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A+ «Data Structures and Algorithm Analysis in C 一 书 第 2 版 的 简体 中 译本 。 原 书 曾 
被 评 为 20 世 纪 顶 尖 的 30 部 计算 机 著作 之 一 ， 作 者 Mark Allen Weiss 在 数据 结构 和 算法 分 析 方 面 
卓 有 建 树 ， 他 的 数据 结构 和 算法 分 析 的 著作 尤其 畅销 ， 并 受到 广泛 好 评 ， 已 被 世界 500 余 所 大 
学 用 作 教 材 。 

在 本 书 中 ， 作 者 更 加 精炼 并 强化 了 他 对 算法 和 数据 结构 方面 创新 的 处 理 方 法 。 通 过 C 程 序 的 
实现 ， 着 重 阐述 了 抽象 数据 类 型 的 概念 ， 并 对 算法 的 效率 .性 能 和 运行 时 间 进 行 了 分 析 ， 

全 书 特 点 如 下 ; 

e 专用 一 章 来 讨论 算法 设计 技巧 ， 包 括 贪 楚 算 法 、 分 治 算法 .动态 规划 、 随 机 化 算法 以 及 回 济 算 法 

e 介绍 了 当前 流行 的 论题 和 新 的 数据 结构 ， 如 斐 波 那 契 肉 ， 糙 堆 ， 二 项 队列 ， 跳 跃 表 和 伸展 树 

e 安排 一 章 专 门 讨 论 摊 还 分 析 ， 考 查 书 中 介绍 的 一 些 高 级 数据 结构 

e 新 开辟 一 章 讨论 高 级 数据 结构 以 及 它们 的 实现 , 其 中 包括 红 黑 树 , 自 顶 向 下 伸展 树 . treapp. k-d 


树 、 配 对 堆 以 及 其 他 相关 内 容 
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本 书 是 国外 数据 结构 与 算法 分 析 方 面 的 标准 教材 ,介绍 了 数据 结构 (大 量 数据 的 组 织 方 法 ) 
以 及 算法 分 析 {( 算 法 运行 时 间 的 属 算 }。 本 书 的 编 瑟 日 标 是 同时 讲授 好 的 程序 设计 和 算法 分 析 
靶 巧 ,使 读者 可 以 开发 出 具有 景 高 效率 的 程序 。 

本 书 可 作为 高 级 数据 结构 课程 或 研究 生 一 年 级 算法 分 析 课 程 的 教材 ,使 用 本 书 逢 具有 -- 些 
中 级 程序 设计 知识 ,还 需要 离散 数学 的 一 些 背 景 知 识 。 


Authorized translation from the English language edition entitled Data Structures and Algorithm 
Analysis in C, Second Edition by Mark Allen Weiss, ( ISBN0-201-49840-5) published by Pearson Edu- 
cation , Inc, publishing as Addison Wesley Longman, Copyright © 1997 by Addison Wesley Longman, 
Inc. 

All rights reserved. No part of this book may be reproduced or transmitted in any form or by any 
means, electronic or mechanic, including photocopying, recording, or by any information storage re- 
trieval system, without permission of Pearson Education, Inc. 

Chinese simplified language edition published by China Machine Press. 

Copyright (€ 2003 by China Machine Press. 


本 书 中 文 简体 学 版 由 美国 Pearson Education 培 生 教育 出 版 集团 授权 机 械 工 业 出 版 社 独 家 出 
版 。 未 经 出 版 者 书面 许可 ,不 得 以 任何 方式 复制 或 抄袭 本 书 内 容 。 
版 权 所 有 , 慢 权 必 究 。 


本 书 版 权 登 记号 :图 宇 :01-2001-2200 


国 书 在 版 编目 {CIP) 数 据 


数据 结构 与 算法 分 析 :C 语言 描述 ( 原 书 第 2 R/C SS ES LB SES. -北京 :机 械 工业 
出 版 社 ,2004. I 

(计算 机 科学 从 书 ) 

书 名 原文 :Data Structures and Algorithm Analysis in C: Second Edition 

ISBN 7-111-12748-X 


I. 数 … D.D- OS 1. Ca 加 算法 分 析 (BC 语言 -程序 设计 
IW.TP311.12 


中 国 版 本 图 书馆 CIP 数据 核 字 (2003) 第 068447 号 


机 械 工 业 出 版 社 ! 北 京 市 西城 区 百 万 床 大 街 22 E ARO 100037) 
责任 编辑 : OH 


北京 牛山 世 兴 印刷 厂 印 删 - 新 华 书 店 北京 发 行 所 发 行 


2004 年 1 月 第 1 版 第 1 次 印刷 
787mm X 1092mm 1/16 - 25.5 印张 
印 数 : 0 001-5 000 册 

eft: 35.00 30 


凡 购 本 书 , WARE., 倒 页 、 脱 页 ， 由 本 社 发 行 部 调换 
本 社 购 书 热 线 电 话 :(010)68326294 


由 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 这 步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 区 出 、 独 领 风 暗 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 械 来 越 紧 密 地 结合， 计算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 各 教学 的 最 前 线 ， 由 此 而 产 牛 的 经 鉴 科 学 著作 ， 不 仅 澡 
划 了 妈 究 的 范畴 ， 还 揭 药 了 学 本 的 源 变 ， 醋 遵循 学 术 规 范 ， 又 月 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 . 

近年 ， 在 全 球 依 息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 
蜗 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建 没 在 教育 战略 
上 显得 举足轻重 ， 在 我 国信 息 技术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积 淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 同 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接 罗 、 建 
没 真正 的 志 界 一 流 大 学 的 必由之路 - 

机 械 工业 出 版 社 华章 图 文 信息 有 限 公 司 较 时 意识 到 “上 出 版 要 为 教育 服务 "。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 进 选 、 称 译 国 让 优秀 教材 上 。 经 过 几 年 的 不 懈 和 努力 ， 我 们 与 
Prentice Hall, Addison-Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著 包 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 王选 出 Tanenbaum，Stroustrup，Kernighan， 
Jim Gray 等 大 师 名 家 的 … 批 经 典 作品 ， 以 “计算 机 科学 丛书” 为 总 称 出 版 ， 供 谈 者 学 习 、 研 
RMR. KHOR, REARS REAR, 

“TPA SLESEAH” HOR PEST BASES ROS BD, BAM SRA Dj 
肯 的 选 题 指导 ,还 不 辞 劳苦 也 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专 诚 为 其 书 的 中 译本 作 序 . 僻 今 ,“ 计 算 机 科学 其 书 ” 已 经 出 版 了 近 百 个 
品种 ， 这 些 书籍 在 污 者 中 树立 了 良好 的 口 看 ， 并 被 许多 沪 校 采用 为 正式 教材 和 参考 书籍 ,为 
进 - 步 推广 与 发 展 打 下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 入 一 个 新 的 阶段 。 为 此 ， 华 章 公 司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 ， 除 “计算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “ 既 典 原版 书库 ”:， 同 时， 引进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” 系 列 组 成 
“全 美 姑 典 学 习 指导 系列 "， 为 了 保证 这 二 套 丛 书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公司 聘请 了 中 国 科学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 旦 大 和 学 、 上 上 
海 交 通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科 技 大学、 哈尔滨 工业 大 学 、 西 安 交 通 太 学 、 中 国 
人 民 大 淮北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 山 太 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 漳 
ILR. 中 国 国 家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 等 名 学 者 组 成 “专家 指导 委员 会 "， 为 我 们 提供 选 题 意见 利 出 版 上 监督。 

这 三 人参 内 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 


的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. 工 工 ，Stanford，U.C. Berkeley, C. M. U. itt? 
名 上牌 太 党 所 采用 不仅 亩 盖 了 程序 设计 、 数 据 结构 、 操 作 和 系统、 计算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工程 、 图 形 学 、 通 优 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普通 寺 届 的 核 
心 课 程 ， 而 且 各 有 具 特色 一 一 有 的 出 自 语 言 设 计 者 之 手 、 有 的 历经 三 十 年 而 不 二 、 有 的 局 被 全 
世界 的 几 百 所 高 校 采用 .在 这 些 圆 熟 通 捕 的 名 师 太 作 的 指引 之 下 ， 读 者 必 将 在 订 算 机 科学 的 
宫殿 中 由 登 党 而 人 室 . 

权威 的 作者 ， 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 精细 的 编辑 ,这些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只是 我 们 的 后 续 服务 的 起 点 。 华 章 公 司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 子 指正 ， 我 们 的 联系 方法 如 下 ， 


Fa TARH: hzedu@hzbook.com 

联系 电话 : (010 ) 68995264 

联系 地 址 : dio m PREX ES FERE EU 
邮政 编码 : 100037 
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随 着 速度 的 不 断 提 高 和 存储 容量 的 持续 增长 ,计算 机 的 功能 日 益 强大 ,从 而 处 理 数 据 和 解 
决 问题 的 规模 和 复杂 程度 与 日 惧 增 。 这 不 仅 带 来 了 需要 认真 研究 的 新 课题 ,而 且 突 出 了 原 有 
数据 结构 和 算法 效率 低下 的 缺点 。 程 序 的 效率 问题 不 是 由 于 计算 机 功能 的 强大 而 受到 冷落 ， 
相反 地 ,倒是 被 人 们 提 到 前 所 未 有 的 重视 程度 ,因为 大 型 问题 的 解决 所 涉及 到 的 大 容量 存储 和 
高 速度 运 等 容 不 得 我 们 对 效率 有 丝毫 的 忽视 。 本 书 正 是 在 前 述 数据 结构 基本 概念 的 同时 深信 
地 分 析 了 算法 的 效率 。 书 中 详细 介绍 了 当前 流行 的 论题 和 新 的 变化 ,讨论 了 算法 设计 技巧 ,并 
在 研究 算法 的 性 能 ,效率 以 及 对 运行 时 间 分 析 的 基础 上 考查 了 一 些 高 级 数据 结构 ,从 历史 的 角 
度 和 近年 的 进展 对 数据 结构 的 活 唉 领域 进行 了 简要 的 概括 。 由 于 本 书 选 材 新 完 , 方 法 实用 , 题 
HFS ,取舍 得 当 , 因 此 ,自从 出 版 以 来 受到 广泛 欢迎 ,已 被 计 界 许多 知名 大 学 用 作 教 材 。 

本 书 的 目的 是 培养 学 生 良 好 的 程序 设计 技巧 和 熟练 的 算法 分 析 能 力 ,使 得 他 们 能 够 开发 
出 高 效率 的 程序 。 从 服务 于 实践 又 锻炼 学 生 实 际 能 力 出 发 , 书 中 提供 了 大 部 分 算法 的 CC 程序 
和 和 伪 码 例 程 ,但 并 不 是 全 部 。 一 些 程序 可 从 互联 网 上 获得 。 

承蒙 卢 开 梁 教授 、 陈 贤 经 先生 、 温 丽 芳 女士 的 鼓励 , 译 者 有 幸 将 国外 几 部 优秀 原著 介绍 给 
我 国 的 读者 ; 鞠 神 先生 认真 的 工作 使 本 书 译文 免除 不 少 玖 漏 和 错误 ; 杨 海 玲 女 士 的 监督 使 翻译 
工作 比 预 想 的 顺利 。 译 者 在 此 表示 衷心 的 感谢 。 译 者 还 愿意 借 此 机 会 感谢 挚友 孙 华 先生 ,他 
对 本 书 的 翻译 王 作 自始至终 给 予 热心 的 关怀 和 无 私 的 帮助 。 

由 于 时 间 及 水 平 所 限 , 书 中 译文 不 当 之 处 , 统 析 学 术 界 同仁 及 广大 读者 网 正 。 


译 者 
2003 年 9 月 
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本 书 讨论 数据 结 宰 和 芷 法 分 析 。 数 据 结构 主要 研究 组 织 大 量 数 据 的 方法 ,而 算法 分 析 则 
是 对 算法 运行 时 间 的 评估 。 随 着 计算 机 的 速度 越 来 越 快 ,对 于 能 够 处 理 大 量 输 和 人 数据 的 程序 
的 需求 变 得 日 益 急 女 。 可 是 ,由 于 在 输入 量 很 大 的 时 候 ,程序 的 低 效率 现象 变 得 非常 明显 , 因 
此 这 又 要 求 对 效率 问题 给 予 更 仔细 的 关注 。 通 过 在 实际 编程 之 前 对 算法 的 分 析 , 学 生 可 以 决 
定 一 个 特定 的 解法 是 否 可 行 。 例 如 ,学 生 在 本 书 中 将 读 到 一 些 特定 的 问题 并 看 到 精心 的 实现 
方法 是 如 何 把 对 大 基数 据 的 时 间 限 制 从 16 年 减 至 不 到 1 秒 的 。 因 此 ,者 无 运行 时 间 的 阐释“， 
就 不 会 有 算法 和 数据 结构 的 所 出。 在 其 些 情况 下 , 对 于 影响 算法 实现 的 运行 时 间 的 一 些微 小 
绍 节 都 需要 认真 地 探究 。 

一 旦 解法 被 确定 ,程序 还 是 必须 要 编写 的 。 随 着 计算 机 的 日 益 强 大 ,它们 必须 解决 的 问题 
就 变 得 更 加 巨大 和 复杂 ,这 就 要 求 开 发 更 加 复杂 的 程序 。 本 书 的 目的 是 同时 教授 学 生 良 好 的 
程序 设计 技巧 和 算法 分 析 能 力 ,使 得 他 们 能 够 开发 这 样 的 具有 最 高 效率 的 程序 。 

本 书 适合 作为 高 级 数据 结构 (CS7) 课 程 或 是 研究 生 第 一 年 算法 分 析 课 程 的 教材 。 学 生 应 
该 具有 中 等 程度 的 程序 设计 知识 ,包括 像 指 针 和 递归 这 样 一 些 内 容 , 还 要 具有 离散 数学 的 基 些 
知识 。 
方法 

我 相信 ,对 于 学 生 重要 的 是 学 习 如 何 自己 动手 编写 程序 ,而 不 是 从 书 上 上 找 贝 程序 。 但 为 一 
方面 ,讨论 现实 程序 设计 问题 而 不 套用 样本 程序 实际 上 其 不 可 能 的 。 由 于 这 个 原因 ,本 书 通常 
提供 实现 方法 的 大 约 一 半 到 四 分 之 三 的 内 容 并 鼓动 学 生 补足 其 余 的 部 分 。 第 12 章 是 这 一 版 
新 加 的 一 章 ,讨论 主要 仙 重 于 实现 细节 的 一 些 附 加 的 数据 结构 。 

本 书 中 的 算法 均 以 ANS] C 表示 ,尽管 有 些 欠 缺 ,但 它 仍 然 是 最 流行 的 系统 程序 设计 语 
F. CË Pascal 的 使 用 使 得 动态 分 配 数 组 成 为 可 能 (可 见 第 5 章 中 的 "再 散 列 ")。 它 还 在 儿 
人 处 地 方 将 代码 简化 ,这 通常 是 因为 与 (多久) 操作 走 捷径 的 缘故。 

对 CC 的 大 多 数 批评 集中 在 用 它 写 出 的 程序 代码 可 读 性 差 的 事实 上 。 仅 仅 少 击 几 次 键 ,者 
牺牲 了 程序 清晰 性 ,而 程序 的 速度 又 没有 增加 。 因 此 ,诸如 同时 贡 值 以 及 通过 

i£(íx-wy] 
测试 是 否 为 0 等 技巧 一 般 不 在 本 书 中 使 用 。 相 信 本 书 将 证 明 只 要 细心 练习 是 可 以 避免 那些 难 
以 读 懂 的 代码 的 。 


内 容 提要 
第 1 章 包 含 离散 数学 和 递归 的 一 些 复习 材料 。 我 相信 对 递归 做 到 泰然 处 之 的 惟一 办 范 是 


Wl 


反复 不 断 地 看 一 些 好 的 用 法 。 因 此 , 除 第 5 Boh Ri RAPE EE IT ZR 

第 2 童 处 理 算法 分 析 . 这 一 音效 述 洛 进 分 析 和 人 它 的 主要 弱点 。 这 里 提供 了 许多 例子 ,也 
括 对 对 数 运行 时 间 的 深 和 人 解释。 通过 直观 地 把 一 些 简 单 递归 程序 转变 成 迭代 程序 而 对 它们 进 
行 分 析 。 介 绍 了 更 为 复杂 的 分 治 程序 ,不 过 有 些 分 析 ( 求 解 递归 关系 } 要 推迟 到 第 7 意 再 详细 
讨论 。 

第 3 章 包括 表 . 栈 和 队列 。 重 点 放 在 使 用 ADT 对 这 些 数 据 结 构 编程 ,这 些 数据 结构 的 快 
速 实 现 ,以 及 介绍 它们 的 某 些 用 途上 。 课文 中 玫 乎 没有 什么 程序 (只 有 些 例 程 ) ,而 程序 设计 作 
业 的 许 客 思想 基本 上 体现 在 练习 之 中 。 

第 4 章 讨 论 树 , 重 点 在 查找 树 ud P Bd HP (BR). UNIX 文件 系统 和 表达 式 树 是 作 
为 例子 来 介绍 的 。AVL 树 和 伸展 树 只 作 了 介绍 而 没有 人 分析。 程序 写 出 7596 ,其 余部 分 留 给 
学 生 完成 。 查 我 树 的 实现 细节 见 第 12 章 。 树 的 另外 一 些 内 雁 , 如 文件 压缩 和 博 主 树 , 延 返 到 
第 10 章 讨 论 。 外 部 媒体 上 的 数据 结构 作为 几 章 中 的 最 后 论题 来 讨论 。 

第 5 章 是 相对 较 旺 的 一 章 .主要 讨论 散 列 表 。 这 里 进行 了 某 些 分 析 ,本 章 末 尾 讨论 了 可 扩 
散 列 。 

第 6 章 是 关于 优先 队列 的 。 二 义 堆 也 在 这 里 讲授 , 述 有 些 附 加 的 材料 论述 优先 队列 某 些 
理论 上 有 趣 的 实现 方法 。 裴 波 那 契 堆 在 第 11 章 讨论 ,配对 堆 在 第 12 章 讨论 。 

第 7 章 讨论 排序 。 它 特别 关注 编程 细节 和 分 析 。 讨 论 并 比较 所 有 通用 的 排序 算法 。 对 以 
下 四 种 算法 详细 地 进行 了 分 析 : 插 和 人 排序 、 希 尔 排 序 、 堆 排序 以 及 快速 排序 。 堆 排序 平均 情形 
运行 时 间 的 分 析 对 子 这 一 版 来 说 是 新 的 内 容 。 本 章 末 尾 讨 论 了 外 部 排序 。 

第 8 章 讨 论 不 相交 集 算法 并 证 明 其 运行 时 间 。 这 是 短 且 特殊 的 一 章 ,如 果 不 洁 论 Kruskal 
算法 则 该 章 可 跳 过 。 

第 9 章 讲授 图 论 算法 。 图 论 算法 的 重要 人 性 不 仅 因为 它们 在 实践 中 经 常用 到 ,而 且 还 因为 
它们 的 运行 时 间 强 烈 地 依赖 于 数据 结构 的 怡 当 使 用 。 实 际 上 ,所 有 标准 算法 都 是 和 相应 的 数 
据 结构 . 板 代 码 以 及 运行 时 间 的 分 析 一 起 介绍 的 。 为 把 这 些 问 题 放 进 一 本 适当 的 教材 中 ,我 们 
对 复杂 性 理论 {包括 NP- 完 全 性 和 不 可 判定 性 ) 进 行 了 简短 的 讨论 。 

第 10 章 通 过 考查 一 般 的 问题 求解 技巧 讨论 算法 设计 。 这 一 章 添 加 了 了 大量 的 实例 。 这 里 
及 后 面 各 意 使 用 的 伪 代 码 使 得 学 生 更 好 地 理解 例子 ,而 避免 被 实现 的 细节 所 困扰 。 

第 11 音 处 理 挫 还 分 析 。 对 来 自 第 4 章 到 第 6 章 的 三 种 数据 结构 以 及 本 章 介绍 的 莫 波 那 
契 堆 进行 了 分 析 。 

第 12 章 是 这 一 版 新 加 的 一 章 ,讨论 查找 树 算法 、k-d 树 和 配对 堆 。 不 同 于 其 他 各 章 , 本 音 
给 出 了 查找 树 和 配对 堆 完 全 的 仔细 的 实现 。 材 料 的 安排 使 得 教师 可 以 把 一 些 内 容纳 入 到 其 他 
各 音 的 讨论 之 中 。 例 如 ,第 12 章 中 的 自 项 向 下 红 黑 树 可 以 在 (第 4 章 的 )AVL 树 下 讨论 。 

第 1 意 到 第 9 章 为 大 多 数 的 一 学 期 数据 结构 课程 提供 了 足够 的 材料 。 如 果 时 间 人 允许 , 那 
么 第 10 章 也 可 以 包括 进来 。 研 究 生 的 算法 分 析 课程 可 以 使 用 第 7 章 到 第 11 章 的 内 容 。 第 
11 音 所 分 析 的 高 级 数据 结构 可 以 容易 地 在 前 面 各 章 中 查 到 。 第 9 章 中 对 NP- 完 全 性 的 讨论 
对 于 这 门 课 来 说 太 过 简要 ,Garey 和 Johnson 的 论 NP- 完 全 性 的 书 ( 有 张 立 昂 等 翻译 的 中 文 译 
本 :计算 机 和 难 解 性 ,科学 出 版 社 ,1987 一 一 译 者 注 ) 可 以 补充 本 书 的 不 是 。 





练习 


在 每 章 末 尾 提 供 的 练习 与 书 中 讲授 的 内 容 顺 序 相 匹配 。 最 后 的 一 些 练习 是 针对 整个 一 章 
而 不 是 特定 的 某 一 节 。 难 做 的 练习 标 以 一 个 星 呈 ,更 难 的 练习 标 有 两 个 星 号 。 
教师 可 从 Addison-Wesley 出 版 公司 得 到 包含 几乎 所 有 练习 管 案 的 解 题 指南 。 


参考 文献 


参考 文献 位 于 每 章 的 最 后 。 一 般 说 来 ,这 些 参考 文献 或 者 是 历史 性 的 ,代表 着 书 中 材料 的 
原 她 来 源 , 或 者 闭 述 对 书 中 给 出 的 结果 的 扩展 和 改进 。 有 些 文 献 论述 了 一 些 练习 的 解法 。 


代码 的 获得 


本 书 中 的 程序 代码 通过 匿名 ftp 可 在 aw. com 网 站 得 到 。 这 个 网 站 也 可 以 道 过 World 
Wide Web 来 访问 ;其 URL 为 http: AAwww. aw. com/cseng/( Mb s Sk Be pe HE). ER VELIS NE 
确 位 置 可 能 变化 。 
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第 1 章 5l 论 


在 这 一 章 , 我 们 阐述 本 书 的 目的 和 旧 标 并 简要 复习 离散 数学 以 及 程序 设计 的 一 些 概 念 。 
我 们 将 要 ， 
”看 到 程序 在 较 大 输入 情况 下 的 运行 性 能 与 在 适量 输入 情况 下 的 运行 性 能 具有 同等 重 
ATE. 
+ 总 结 本 书 其 余部 分 所 需要 的 基本 的 数学 基础 。 
简要 复习 递归 。 


1.1 本 书 讨 论 的 内 容 


设 有 一 组 N 个 数 而 要 确定 其 中 第 ORAS. 我 们 称 之 为 选择 问题 (selection problem). 
大 多 数学 习 过 一 两 门 程序 设计 课程 的 学 生 写 一 个 解决 这 种 间 题 的 程序 不 会 有 什么 困难 。“ 显 
而 复 见 的 ” 解 快 方法 有 很 多 。 

该 问题 的 一 种 解法 就 是 将 这 N 个 数 读 进 一 个 数组 中 , 再 通过 某 种 简单 的 算法 ,比如 时 泡 
排序 法 ， 以 递减 硕 序 将 数组 排序 ,然后 返回 位 置 上 上 的 元 察 。 

稍微 好 一 点 的 算法 可 以 先 把 前 个 元 素 读 入 数组 并 (以 递减 的 顾 序 ) 对 其 排序 。 接 着 , 将 
剩 下 的 元 素 再 逐个 读 入 。 当 新 元 宗 被 读 到 时 , MRE DFRAPIS k PRM SH, 否则 
就 将 其 放 到 数组 中 正确 的 位 置 上 , 同时 将 数组 中 的 一 个 元 染 挤 出 数组 。 当 算法 终止 时 , 位 于 
第 六 个 位 置 上 的 元 宗 作 为 答案 返回 。 

这 两 种 算法 编码 都 很 简单 ,建议 读者 试 一 试 。 此 时 我 们 自然 要 问 :哪个 算法 更 好 ? RR 
He? 还 是 两 个 算法 都 足够 好 ? 使 用 含有 一 百 万 个 元 素 的 随机 文件 , ŒE k= 500 000 的 条 
件 下 进行 模拟 发 现 , 两 个 算法 在 合理 的 时 间 量 内 均 不 能 结束 ; 每 种 算法 都 需要 计算 机 处 理 若 
干 天 才能 算 完 (虽然 最 后 还 是 给 出 了 正确 的 答案 )。 在 第 7 章 将 讨论 另 一 种 算法 ,该 算法 将 在 
一 秒 钟 左右 给 出 问题 的 解 . 因此 ， 虽 然 我 们 提出 的 两 个 算法 都 能 算出 结果 , 但 是 它们 不 能 被 
认为 是 好 的 算法 ,因为 对 于 第 三 种 算法 在 合理 的 时 间 内 人 能够 丸 理 的 输入 数据 量 而 言 ， 这 两 种 
算法 是 完全 不 切实 陈 的 。 

第 二 个 问题 是 解决 一 个 流行 的 字谜 。 输入 是 由 一 些 字母 和 单 
词 的 二 维 数组 组 成 。 目 标 是 要 找 出 字谜 中 的 单词 ,这些 单词 可 能 
是 水 平 、 垂 直 或 沿 对 角 线 以 任何 方向 放置 的 。 作为 例子 , 图 1-1 
所 示 的 字谜 由 单词 this, two. fat 和 that 组 成 。 单词 this 从 第 一 
行 第 一 列 的 位 置 即 (1, 1) 处 开始 并 延伸 至 (1, 4); 单词 two MCI, 
1) 到 (3, 1); fat 从 (4,，1) 到 (2,3); m that MAC, HEGI, 1). 

现在 至 少 有 两 种 直观 的 算法 来 求解 这 个 问题 。 对 单词 表 中 的 每 个 单词 ,我们 检查 每 一 个 
有 序 三 元 组 ( 行 , WN, 方向 ), 验证 是 否 有 单词 存在 。 这 需要 大 量 檬 套 的 for f, 但 它 基 本 上 
是 直观 的 算法 ， 

也 可 以 这 样 ,对 于 每 一 个 尚未 进行 到 字谜 最 后 的 有 序 四 元 组 ( 行 , 列 , 方向 , 字符 数 ) 我 
们 可 以 测试 所 指 的 单词 是 否 在 单词 表 中 。 这 也 导致 使 用 大 量 项 套 的 for 循 环 。 如 果 在 任意 单 





图 1-1 字迹 示例 


[2] 


FE 


闻 中 的 最 大 字符 数 已 知 , 那么 该 算法 有 可 能 节省 一 些 时 间 。 

上 述 两 种 方法 相对 来 说 都 不 难 编码 并 可 求解 通 沉 发 表 于 杂志 上 的 许多 现实 的 字迹 游戏 。 
这 些 字谜 通常 有 16 行 16 列 以 及 40 个 左右 的 单词 。 然 而 ,假设 我 们 把 字谜 变 成 为 只 给 出 谜 板 
(puzzle board) 而 单词 琢 基 本 上 是 一 本 英语 词典 ， 则 上 面 提 出 的 两 种 解法 需要 相当 可 观 的 时 间 
来 解决 这 个 问题 , 故 这 丙种 方法 都 是 不 可 接受 的 。 不 过 , 这 样 的 问题 还 是 有 可 能 在 数秒 内 解 
决 的 , 即使 单词 表 很 大 也 可 以 。 

在 许多 问题 当中 , 一 个 重要 的 观念 是 : 写 出 一 个 可 以 工作 的 程序 并 不 够 。 如 条 这 个 程序 
在 巨大 的 数据 集 上 运行 , 那么 运行 时 间 就 变 成 了 重要 的 问题 。 我 们 将 在 本 书 中 看 到 对 于 大 量 
的 输入 ,如 何 估计 程序 的 运行 时 间 , 尤其 是 如 何在 尚未 具体 编码 的 情况 下 比较 两 个 程序 的 运 
行 时 间 。 我 们 还 将 看 到 御 底 改进 程序 速度 以 及 确定 程序 瓶颈 的 方法 。 这 些 方法 将 使 我 们 能 够 
找到 需要 大 为 优化 的 那些 代码 段 。 


1.2 数学 知识 复习 


这 一 节 列 出 一 些 需要 记 住 或 是 能 够 推导 出 的 基本 公式 , 复习 基本 的 证 明 方 法 。 
1.2.1 指数 
AXE — x^*B 
x = X^ -B 
(X^ y? — As 
XN + XN =A XY 
2N ,2N -2N*! 
1.2.2 对 数 
在 计算 机 科学 中 , 除非 有 特别 的 声明 ,所 有 的 对 数 都 是 以 2 为 底 的 。 
EM: X =B, SAMS logyB- A 
由 该 定义 可 以 得 到 几 个 方便 的 等 式 。 
定理 1.1 


_ logcB 
logaB -goA ' C»0 


证 阴 : 
4 X -logcB, Y —-logoA, UR Z=logaB。 此 时 由 对 数 的 定义 得 :CXY=B8, C1!=A 以 及 
A =B, 联合 这 三 个 等 式 则 产生 (CY')*= C= B. AM, X= YZ, 这 意味 着 Z-X/Y, 
定理 得 证 。 
定理 1.2 

logAB = logA + logB 
ur AA: 
A> X -log A, Y=log B, UR Z=logAB. 此 时 由 于 假设 默认 的 底 为 2, 2*-A,2' - B 
及 2!- AB, 联合 最 后 的 三 个 等 式 则 有 212! 22^ = AB, 因此 X+ Y 77, 这 就 证 明了 该 
定理 。 
其 他 一 些 有 用 的 公式 如 下 , 它们 都 能 够 用 类 似 的 方法 推导 。 


3] rÉ 3 


log A /B =logA - logB 

log( AP) = H log A 

logX < XX( 对 也有 的 X 20 IE.) 

log 1-0, log 2=1, log | 024—10, log t 048 576 — 20. 
1.2.8 RB 

最 容易 记忆 的 公式 跨 


NI - 2l —] 


在 第 二 个 公式 中 , AR OA, M 
Sac 


"EN 趋 于 om 时 该 和 趋向 于 L/UL- A), 这 些 公式 是 “几何 级 数 " 公式 ， 
我 们 可 以 用 下 面 的 方法 推导 关于 3 AO < A< DHAR $ SS 表示 和 .此 时 
S-]1]4 A A* 4 A+ A* e Ao e 
TH 
AS = Ac A? AŻ Att A been 
———— — 等 号 右边 所 有 的 项 相 消 ,只 贸 
F1: 
S-AS = 1 
这 就 是 说 
1 
571-A 
可 以 用 相同 的 方法 计算 57 225. CE TARBI. 我 们 与 成 


~1,2,3, 4,35. 
5 2 +52 3*5" 95 ^ 


"arem 


用 2 3&2 CEU 
_ 2,3,485,5.,95,... 
25 = 1+5 +53 tataa tast 
将 这 两 个 方程 相 减 得 到 
t L,l,l,1,... 
Saltza t 
A, S-2. 


分 析 中 另 一 种 常用 类 型 的 级 数 是 算术 级 数 。 任 何 这 样 的 级 数 都 可 以 通过 基本 公式 计算 其 值 、 


sv, = NAD LD N? 
7 2 2 


例如 ， 为 求 出 和 2+5+81 - (38 1), HEHEEEX304243:)5:t5)-ClI-H0I91 
perd), BAR, 它 就 是 GR(R e D/2— k, 另 一 种 记忆 的 方法 则 是 将 第 - -项 与 最 后 一 项 相 如 





CRUS 3b € 0, BOIS RS ORT CREE 3k +1), 等 等 。 APR 72 个 这 样 的 数 对 ， 
ARE 2(32+1)/2, 这 与 前 面 的 答案 相同 。 

现在 介绍 下 面 丙 个 公式 , 它们 就 没有 那么 常见 了 。 
Y Az MN EDON ED NP 
全 3 


1 





Y k+l 
È e N — 
2 i feta, 67-1 


当下 = 一 1 时, 后 一 个 的 公式 不 成 立 。 此 时 我 们 需要 下 面 的 公式 , 这 个 公式 在 计算 机 科学 
中 的 使 用 要 远 比 在 数学 其 他 科目 中 使 用 得 多 , HS 叫做 调和 数 , 其 和 叫做 调和 和 ,下面 近 
位 式 中 的 误差 条 同 于 y=0.57721566, 这 个 情 称 为 欧 拉 常数 (Euler s constant) e 


Hy = > 了 e log.N 
以 下 两 个 公式 只 不 过 是 一 般 的 代数 运算 . 
2; f(N) = NECN) 


$3 fG) = 2; faa) - 2; f) 

1.2.4 模 运算 

如 果 N 整除 A 一 B. 那么 我 们 就 说 A 与 B8 模 NN 同 余 (oongruenm), i079 A=B(mod N}. E 
WHS, 这 意味 着 无 论 A 还 是 BERNER, 所 得 余数 都 是 相同 的 。 于 是 , B1561—1(mod 10). 
如 同等 号 的 情形 一 样 , d: A 三 Blmod N), WI A+ C=B+ Cmd N) 以 及 AD-—RD(mod NJ. 

有 许多 的 定理 适用 模 运 算 , 其 中 有 一 些 特别 要 用 到 数论 来 证 明 。 我 们 将 谨慎 地 使 用 模 适 
算 , 这 样 ,前 面 的 一 些 定理 也 就 足够 了. 
1.2.5 证 明 方 法 

证 明 数 据 结构 分 析 中 的 结论 的 两 个 最 常用 的 方法 是 归纳 法 和 反 证 法 (偶尔 也 被 连用 到 只 
有 教授 们 才 使 用 的 证 明 方 法 )。 让 明 一 个 定理 不 或 开 的 最 好 的 方法 是 举 出 一 个 反例 
归纳 法 证 朋 

出 归纳 法 进行 的 证 明 有 两 个 标准 的 部 分 。 第 一 步 是 证 明基 准 情形 (base case), 就 是 确定 
BD TAE OR) JS GE SB TET) ELE RE s 这 一 步 玫 乎 总 是 很 简单 的 。 接着, 进 
行 归 纳 假 设 (inductive hypothesis)。 一 般 说 来 ， 这 意味 着 假设 定理 对 直到 某 个 有 限 数 * 的 所 有 
的 情况 都 是 成 立 的 。 然后 使 用 这 个 假设 证 明定 理 对 下 一 个 什 ( 通 常 是 + 1) 世 是 成 立 的 。 至 此 
定理 得 证 (在 点 是 有 限 的 情形 下 ) 

作为 一 个 例子 , 我 们 证 明 斐 波 那 契 数 ，Fo= d, Fio l1, F2=2, Facts Fy=5, ,.., 
F =F, +F, 2, ILE F< (53). CAE BLE Fo=0， 这 只 不 过 将 该 级 数 做 了 
一 次 平移 ) 为 了 证 明 这 个 不 等 去， 我 们 首先 验证 定理 对 平 几 的 情形 成 立 。 容易 验证 FS < 
5/3 及 F,-22«25/9, 这 就 证 明了 基准 情形 。 假设 定理 对 于 i51, 2 k BOE. 这 就 是 归 
WEE. 为 了 证 明定 理 , 我 们 须要 证 明 Fap LGBT 根据 定义 我 们 有 

F; = Fy t+ Pees 
将 归纳 假设 用 于 等 号 右边 , 我 们 得 到 


Fasc (SA) 03)» 
« (3/9)(5/3)4'1 + (375y (873)! 
« (375)(5/3)*'! + (9725) (5/3)! 
化 简 后 为 
Fad GA — 925) (573) F 1! 
< (24/25)(573) 7 
< (8/3)7 
xx EUH] pix ug. 
(C55 iin. ER HEAR P ee PE 
定理 1.3 


SU N21, yN p- MOLCDON D 
very SS 
1--] 


证 明 : 用 数学 归纳 法 让 切 , 对 于 基准 情形 , 容易 看 到 , 定理 当 N=1 的 叶 候 成 立 - 对 于 归 L6 
NER. 我 们 这 定理 对 URN Bi. 我 们 将 在 该 息 设 下 证 明定 理 对 于 NN ! 0 也 是 成 并 的 








我 们 有 有 
^1] ^ 
P= PHN GD) 
-1 L 
if FAY A EER IITE 
Sis NUN LES 0D. (N11 
= (N+ p [8€ * 1) (N+ D), 
TIN T 
ONE D ZN 全 | 6 
(NHIN I DON 43) 
B 6 
E JE, 
SG. ON-DION 41 -1]20N 2 D 9 1j] 
m 
定理 得 让 
通过 反例 证 明 
公式 PELLI Bur. 证 明 这 个 结论 的 最 容易 的 方法 就 是 计算 Fy = 144» 11. 
上 反 证 法 证 阴 


厅 汪 法 证 明 是 通过 假设 定理 不 成 立 ， 然 后 证 明 该 假设 导 笃 革 个 已 知 的 必 质 不 成 立 , 从 而 
说 明 底 假设 是 错误 的 。 -个 经 典 的 例子 是 证 明 存在 无 穷 多 个 素数 。 为 了 证 明 这 个 结论 , 我 们 
假设 定理 不 成 六 。 于 是 ， 存 在 菜 个 最 大 的 过 数 Pe OP Po o Pe 居 依 序 排列 的 所 有 类 
BEA KE 
N = P,ESPye Py +3 
显然。N 是 比 PP， 大 的 数 ,根据 假设 N REAR. TE. Pi Poor, Pi ARERR. BUS 
党 得 的 结果 总 有 余数 1。 这 就 产生 一 个 东 慎 ,网 为 每 “个 整数 或 者 是 素数 , 或 者 中 素数 的 乘 


EE 


É o RF 


E. 内 此 , P, 是 最 大 素数 的 原 假设 是 不 成 六 的 , 这 正 意味 着 定理 成 ， 
1.3 ifie 


FR (r 1328 BI & BCBS AA PE RY. 例如 , 我 们 可 以 利用 公式 
C= 5(F — 32) 和 
把 华氏 温度 转换 成 摄氏 温度 。 有 了 这 个 公式 , 写 一 个 C ARAARA ET 2 除去 程序 中 的 说 明 
和 太 括 号 外 , HAAR RT OC E. 

有 时 候 数 学 函数 以 不 太 标 准 的 形式 来 定义 。 作 为 -个 例子 , 我 们 可 以 在 非 负 整 数 集 上 征 
LAAR OF, EGUEPF(QOTOHF(OX)-22FOX — D 9 X2, 从 这 个 定义 我 们 看 到 F(1)=1.， 
F(2)=6, F(3)=21, 以 及 下 (4) 二 58。 当 一 个 函数 用 它 自己 来 定义 时 就 称 为 是 递归 (recur- 
sive) fj. C 允许 函数 是 递归 的 。 中 但 重要 的 是 要 记 住 , C 提供 的 仅仅 司 遵 循 递归 思想 的 一 种 企 
图 。 不 是 所 有 的 数学 递归 函数 都 能 有 效 地 {或 正确 地 ) 由 C 的 递 妇 黎 拟 来 实现 。 RELE E PITE 
说 的 是 递归 函数 上 应 该 只 用 几 行 就 能 表示 出 来 ,正如 非 递 归 苯 数 一 样 。 图 1-2 48 H3 T PRK F 
的 递归 实现 。 









int 
FC int X 3 





i 
f* 1*/ if( X == 0 J 


/* py return 0: 
else 
f* 3*/ return 2 * F( X- 1) X * Xi 
} 


图 1-2 — PE RK 


第 一行 和 第 二 行 处 理 基 准 情 况 (base case),， 即 此 时 函数 的 值 可 以 直接 算出 而 不 用 求助 递 
IH. “FCX)=2F(X-1) + X^" 车 没有 “F(0)=0” 这 个 条 件 在 数学 上 没有 意义 一 样 , C 
的 递 妇 函数 车 无 基 准 情况 , tii EUER XLI. SHATNER. 

关于 递归 , 有 几 个 重要 并 且 可 能 会 被 搞 混 的 地 方 。 一 个 常见 的 问题 是 : 它 是 否 就 是 循环 
3E 8 (circular logic)? AEE: BARN XTRA AMT ORES, 但 是 我 们 并 没有 
用 函数 本 身 定义 该 函数 的 一 个 特定 的 实例 。 换 名 话说 ,通过 使 用 F(5) 来 得 到 (5) 的 值 才 是 
循环 的 。 通 过 使 用 F(4) 得 到 F(5) 的 值 不 是 循环 的 , 除非 F(4) 的 求 值 又 要 用 到 对 FS) 的 计 
E. 两 个 最 重要 的 问题 恺 怕 就 是 “如 何 ”和 “为 什么 ”的 问题 了 。 这 将 在 第 3 音 正 式 解 决 。 这 
里 , 我 们 将 给 出 -个 不 完全 的 描述 。 

实际 上 ,递归 调用 在 处 理 上 与 其 他 的 调用 没有 什么 不 同 。 如 果 以 参数 4 的 值 调 用 函数 下 ， 
那么 程序 的 第 三 行 要 求 计算 2F(3) + 4* 4。 这 样 , 就 要 执行 一 个 计算 F(3) 的 调用 , 而 这 又 导 
致 计算 2F(2)+3*3。 因 此 , 又 要 执行 另 一 个 计算 F(2) 的 调用 , 而 这 意味 着 必须 求 出 2F(1) 
12x2 的 值 。 为 此 , 通过 计算 2P(0) +1 * 1 而 得 到 FC). 此 时 , F(0) 必 须 被 赋值 。 由 于 这 
DERE, 因此 我 们 事先 知道 FE(0)= 0。 从 而 RCH 的 计算 得 以 完成 , 其 结果 为 L 然后 ， 
FONS. FOURRE Ffd4) 的 值 都 能 够 计算 出 来 。 跟踪 持 起 的 函数 调用 (这 些 调 用 已 经 开始 
但 是 正 等 待 着 递归 调用 来 完成 ) 以 及 它们 中 变量 的 记录 工作 都 是 由 计算 机 自动 完成 的 。 然而 ， 


己 ” 对 于 数 秆 计算 使 用 递 叶 通常 不 是 个 好 主意 。 我们 只 在 解释 基本 论点 时 这 么 做 。 


5] 论 7 





— LL 





重要 的 问题 在 于 ,递归 调用 将 反复 进行 直到 基准 情形 出 现 : 例如 ,计算 PC - DIE TE] 
HjPFC-2), FC-3) $88, APEK n] Seb nof, 因此 程序 也 就 不 可 能 算出 答案- fBl 
尔 述 可 能 发 生 更 加 微妙 的 错误 ,我 们 将 其 展示 在 图 1-3 中 ,图 1-3 中 程序 的 这 种 错误 是 将 第 
三 行 上 的 Bad(1) 定 义 为 Badf1y。 显 然 , 实际 上 Bad (1) 953 RE I! b, 这 个 定 交 给 不 出任 何 线 
R. 因此 , 计算 机 将 会 反复 调用 Badt1) 以 期 解 出 它 的 值 , 最 后 , 计算 机 夭 记 系统 将 证 满 空间 ， 
程序 出 庙 。 一 般 说 来 ,我 们 会 鸯 该 畏 数 对 一 个 特殊 情形 无 效 ， 而 在 其 他 情形 下 是 正确 的 。 但 
此 处 这 各 说 则 不 止 懈 ,因为 Badf2) 调 用 Bad(1), 因此 , Bad(2) dz ARER Hi Bes 不 仅 如 此 ， 
Bad(3), Bad(4), #0 Baa(5) 都 要 调用 Bad(2)，Bad(2) 算 不 出 值 , 它们 的 值 也 就 不 能 求 出 。 事 
i, 除了 0 之 外 , 这 个 程序 对 仔 何 的 N 都 不 能 一 严 算 出 结果 。 对 于 递归 函数 ,不 存在 像 
“ 特 珠 情形” 这样 的 情况 。 
上 面 的 讨论 导致 递归 的 前 两 个 基本 法 则 : 







int 
Bad( unsigned int N ) 


i 
/* 1*/ FON == 0 
/* 2*f return 0; 
else 
/* atf return Rad( N / 3413 «N- 1; 
} 


图 1-3 无 次 止 违 归程 序 


1 .基准 情形 (base case). 你 必须 总 槛 有 其 些 基准 的 情形 , 它们 不 放 递 妆 就 能 求解 . 

2. i d iib making progres). 对 于 那些 需要 沸 妇 求解 的 情形 , 递归 调用 必须 总 能 够 户 
着 产生 基准 情形 的 方向 推进 。 

在 本 书 中 我 们 将 用 递 州 解决 一 些 问题 ， 作 为 韭 数 学 应 用 的 一 个 例子 ， 考虑 AAT 
词典 中 的 词 都 是 用 其 他 的 词 定 义 的 。 当 我 们 查 -个 单词 的 时 候 , RIT] ERRORI ELT HU TRUE, 
于 中 我们 不 得 不 再 查 出 现在 解释 中 的 一 些 词 ,而 对 这 些 词 解释 中 的 某 些 词 我 们 艾 不 理解 , 因 
此 我 们 还 要 继 弦 这 种 搜索 . 因为 闻 典 是 有 限 的 . 所 以 实际 上 ,要么 我 们 最 终 介 到 -处 ,出 日 此 
外 解释 中 所 有 的 单词 (从 而 理解 这 里 的 解释 ,并 按照 查找 的 路 径 回头 理 解 其 余 的 解释 ); RA 
我 们 发 现 这 些 解 释 形成 一 个 循环 , 无 法 明白 共 中 的 意思 , 或 者 在 解释 中 过 要 我 们 理解 的 某 个 
单词 不 在 这 本 词典 里 。 

我 们 理解 这 些 单词 的 递归 策略 如 下 :如 果 我 们 知道 一 个 单词 的 含 父 ， 邦 么 就 算 我 们 成 功 ; 
&W. 我们 就 在 词典 里 查找 这 个 单词 . 如 果 我 们 理解 对 该 词 解释 中 的 所 有 的 单词 , 那么 又 算 
我 们 成 功 ; 否则 , 递归 地 查找 一 些 我 们 不 认识 的 单词 来 “算出 对 该 单词 解释 的 售 父 ， 如果 词 
Ut E SEE CBE, 那么 这 个 过 程 就 能 够 终止 ; 如 果 其 中 一 个 单词 没有 查 刘 或 是 拒 成 循环 征 
LFE), BB Aix Tod BEB ASE 
打印 输出 数 

没 我 们 有 一 -个 正 整数 N 并 希望 把 它 打 印 出 来 。 我 们 的 例 程 的 省 字 为 PrintQut( N} 假设 
仅 有 的 现成 1/0 例 程 将 只 处 理 单个 数字 并 将 其 输出 到 终端 。 我 们 将 这 个 例 程 合 公 为 
PriniDigit; PIAH, "PriniDigi C4) " RETI HI -个 na" SEE dg. 

递归 对 该 问题 提供 -个 非常 简 沾 的 解 .为 打印 “76234”, RE 要 首先 打印 中 “7623”, 然 





8 B1I* 
后 再 打印 出 “4”, 第 二 步 用 语句 “PrintDig 让 (Ng 10)” 很 容易 完成 , 但 是 第 一 步 却 不 比 原 问 题 
简单 多 少 , 它 实际 二 是 同一 个 疝 题 ， 因此 我 们 可 以 用 语 杀 “Printout(NAI0) ”递归 地 解决 它 。 

这 告诉 我 们 如 和 何 去 解决 一 般 的 问题 , SRA BAS FRR AER. 由 于 
我 们 尚未 定义 一 个 基 淮 情况 , 因此 很 清楚 , RNAS SSR, WE SNI, 那么 
我 们 的 基 淮 情形 就 是 “Printbigit(N})”. 现在 ,“Printout(N)” 已 对 每 -一 个 从 0 到 9 的 止 整 
数 做 出 定义 ， 而 更 大 的 正 整 数 则 通过 较 小 的 正 整数 定义 。 国 此 , 不 存在 循环 定义 。 整 个 过 程 S 
如 图 1-4 所 示 。 


void 


PrintOut( unsigned int N ) /* Print nonnegative M */ 





ift H >= 10 35 
PrirtOut( N / 10 3; 
PrintDigit( N € 10 9; 
} 


Po 


图 1-4 打印 整数 的 递归 例 程 

我 们 没有 努力 去 高 效 地 做 这 件 事 。 我 们 本 可 以 避免 使 用 mod 操作 ( 它 的 耗费 是 很 大 的 )， 
ER N9610— N -LN 710] « 10,9 
递归 和 归纳 

我 们 将 使 用 归纳 法 对 上 述 数字 递归 打印 程序 给 予 更 严格 的 证 明 。 

定理 1.4 

对 于 N20, 数 的 递归 打印 算法 是 正确 的 。 

ERARE N 所 含 数字 的 个 数 , 利用 妇 纳 法 证 明 ) 

首先 , MEN 只 有 一 位 数字 , 那么 程序 显然 是 正确 的 , 因为 它 只 是 调用 一 次 PrintDigit。 
然后 , 设 PrintOut 对 所 有 上 位 或 位 数 更 少 的 数 均 能 正常 工作 。 +1 位 的 数字 可 以 通过 其 胸 
位 数字 后 跟 一 位 最 低位 数字 来 表示 。 前 位 数字 形成 的 数 恰好 是 LNZ101, 归纳 假设 它 能 够 
被 正确 地 打印 出 来 , 而 最 后 的 一 位 数字 是 N mod 10, 因此 该 程序 能 够 正确 打印 出 任意 六 +1 
位 数 。 于是, 根据 归纳 法 ， 所 有 的 数 都 能 被 正确 地 打印 出 来 。 

这 个 证 明 看 起 来 可 能 有 些 奇怪 , 实际 上 相当 于 是 算法 的 描述 。 它 阐述 的 是 在 设计 递归 程 
Heb, 同一 问题 的 所 有 较 小 实例 均 可 以 假设 运行 正确 , 递归 程序 只 需要 把 这 些 较 小 问题 的 解 
(它们 通过 递归 奇迹 般 地 得 到 ) 结 合 起 来 而 形成 现行 问题 的 解 。 其 数学 很 据 则 是 归纳 法 。 我 们 
给 出 递归 的 第 三 个 法 则 : 

3. 设计 法 则 (design rule) 假设 所 有 的 递归 调用 都 能 运行 。 这 是 一 条 重要 的 法 则 , HAE 
意味 着 ， 当 设计 递归 程序 时 一 般 没有 必要 知道 短 记 管理 的 细节 ,不 必 试 图 追踪 大 量 的 递归 调 
用 ,追踪 实际 的 遂 归 调用 序列 常常 是 非常 困难 的 。 当 然 , 在 许多 情况 下 , ACAR TERE 
提 的 好 处 ,因为 计算 机 能 够 算出 复杂 的 网 忆 。 

递归 的 主要 问题 是 隐 售 的 得 记 开 销 。 BREA RLS REAR AAR AIX 
笛 化 『 算 法 设计 ， 而 且 也 有 助 于 给 出 更 加 简洁 的 代码 ) , 但 是 递归 绝 不 应 该 作为 简单 for 循环 
的 代替 物 , 我 们 将 在 3.3 闻 更 仔细 地 讨论 递归 涉及 的 系统 开销 。 


D jo (procedure) BIA SHE Ay void BY) PAE. 
O UX [BAF RSE X WER, 
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"P ETO, 关键 是 此 牢记 递 妇 的 四 条 基本 法 则 : 

|. 基准 情形 。 必须 总 有 某 些 基准 情形 ,， ESCA ABE ELH, 

2. BEAR SEL 对 于 那些 害 要 府 岂 求解 的 情形 , 每 一 次 递 册 调用 邦 必 须要 使 求解 状况 朝 接 
Ac Hee PEE ASAT [ul TES XE 

3. 设计 法 则 , BP A BA A BE d 13 - 

4. d p, 8E E M (compound interest rule). 让 求解 一 个 问题 的 同一 实例 时 , CE [n] 
FE AIE H e| CZ PEE) DTE; 

第 四 条 法 的 正确 性 则 将 在 后 面 的 章 526 TEA, fi HEN DE TETEMS UI AE RAB BSB fa 
单数 学 丽 数 的 值 的 想法 一 般 来 说 不 是 一 个 好 主意 . 其 道理 正 足 根据 第 四 条 法 则 。 只 归 在 头脑 
中 沁 住 这 些 法 则 , BLP RI BLA ERE IRI HEB T Hs 


总 结 

这 一 章 为 本 书 其 余部 分 建立 一 个 舞台 。 对 于 面临 大 盟 输 入 的 算法 ,和 它 贞 花费 的 时 间 赴 - 
个 判别 其 好 坏 的 重要 的 标准 .【 当 然 正确 性 足 最 重要 的 。) 速 度 是 相对 的 。 对 于 一 个 问题 企 - 
台 机 器 上 旦 快速 的 算法 存 可 能 对 另 一 个 问题 或 在 不 同 的 机 器 上 就 变 成 了 慢 的 。 我 们 将 华 下 一 
这 讲述 这 些 问题 ,并 将 用 这 里 这 论 的 数学 概念 建立 个 正式 的 模型 。 


练习 

1.] 编写 一 个 程序 解决 选择 问题 令 &= NW7Z2。 画 出 表格 显示 你 的 程序 对 于 N 为 不 同 值 的 
运行 时 间 。 

1.2 编 与 一 个 程序 求解 子 谜 游 戏 问题 。 

1.3 只 使 用 处 天 L/O 的 PrintDigit BR, 编写 -个 过 程 以 输出 任意 实数 (可 以 是 负 的 )。 

1 .4 CHa 


tH inclode filename 


的 语句 ， 它 污 入 文件 filename 并 将 其 插 人 人 到 include 3E] b, include AAU AGRE; ATT 
i. 4t filename 本 身 还 可 以 包含 include 语句 , 但 是 显然 一 个 文件 在 任何 链接 中 部 不 能 包 
令 它 自己 。 编 写 一 个 程序 , 使 它 读 人 被 include 语句 修饰 的 一 个 文件 并 晶 输 出 这 个 文件 ， 
1.5 WH FAAA: 
a. log X « X MAPA X >00 成 立 。 
b. log A?) = BlogA 
1.6 求 下列 各 和 和; 


Ae d gs 


b. ND L 


I0 


RLF 


1.7 


»1.8 


估计 
A i L 


r={N/2! ! 


2 (mod 5) Ik zb? 


1.9 4 F, EE 1.2 Ti PALABRA. 证明 下 询 各 式 : 
a. VF = Fy —2 
b. F< AY, Hoe $-(19/5)72 

x « c. 给 出 by 准确 的 封闭 形式 的 表达 式 。 

1.10 HERA RSA, 

a. v (Gi -)-2N 
Ni M 
b. P= (My 
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Ble 算法 分 析 


Fok (algorithny Æ ACR A 一 个 器 题 震 要 音箱 的 、 帘 清楚 地 指定 的 简单 指令 的 集合 . 对 于 
个 汪 题 ,号 给 定 革 种 算法 并 于 5 以 某 种 方式 ) 硝 定 其 是 正 丧 的 , AS ZOESI--Ib d x 
议 算 法 将 南 归 多少 诸如 时 间 战 空间 等 资 薄 量 的 问题 : 如果 一 个 问题 的 求解 算法 映 要 长 也 一 个 
"jg, BS TGXRPEIESRROGSEAG TÉ ZAHME A om IG AER ETE SA A E 
Wala LL eA | 
件 这 -Ẹ, 我 们 将 讨论 ， 
* 由 | 何 佑 让 一 个 程序 所 需要 的 时 间 ， 
© 如 何 将 一 个 程序 的 运行 时 间 从 大 或 年 降低 到 种。 
+ 料 心 地 使 用 递归 的 后 梁 : 
© 将 一 个 数 和 月 屁 得 到 其 戎 以 及 计算 两 个 数 的 最 大 会 负数 的 非常 有 效 的 算法 . 


2.1 数学 基础 


估计 算法 资源 消 桂 所 需 的 分 析 一 般 说 来 是 … 个 理论 问题 , 内 此 嵩 本 -一 公正 式 的 系统 构 
7t 我 们 先 从 革 些 数学 定义 开 妨 . 

全 书 将 使 用 下 列 下 个 定义 : 

定义 :如 果 存 在 下 常数。 Aly ES Nie ye ME TON) Sef CN). 则 记 为 T(N) = 
OCFONO) 

XE XL Un TE EE BE o T no BEAD NIS uy BE TUN) eg UND. 则 记 为 PON) = 
OU CN)). 

EX: TON) = G(hCN)) MAIS T(N) OU (ND A. TON) = 0 QU NY)), 

EM TONS OLINDA TON) 4 GCpOND), M TON) = oCpGON )) “Ts! 

pee X559 BS ESSE ee E AS, BPR. RA evi. 
A jus pr —A4 PR RE AF — ee, 因此 , 像 OND <a CN Dx EI TT 
ote gay. 于是, Fete e848 SE # relarive rate of growth). MRS FH TSS ICE A 
到 算法 分 析 的 时 候 , 我 们 将 会 明白 为 什么 它 是 车 要 的 度量 ， 

BR N 较 小 时 , 1 000N EE EE NT 大 , 但 N? 以 更 快 的 速度 增长 . 因此 N° RREK, dE 
这 种 情况 下 ，N = 1000 是 转折 点 。 第 一 个 定义 是 说 ， 最 后 总 会 存在 菜 个 点 ny, MEM 
cc ON) de 3g teg TON) REX. AIRES ZR OR. PONDS EON RR 
在 我 们 的 例子 中, PON) S 1000N, FOND 2 N?, org = L000 rj em 1, 3E Lu FATE na 7 10 
"ie = LOO. 因此 , 我 们 可 以 说 1000N = OC N?)(N 平方 级 ) 这 种 记 法 称 为 大 O 记 法 AE 
WIN ALE VÀ 级 的 ”, HD AER CA Oe "6 

i 3e CR PL ASO ERU HE E. AB A TEL RE OT jim 

LLU FUN DEO S.I 第 一 个 定妆 DM VR. "omega" SER TON IR RER 
Y* TOS ON AOR. SRL TEX TON) ACN) CB ane isi TN 的 增 
KR = ACN AHR Rela - Mad PUN) cat pt) CEH om 697 )gL a AE 


d2 m PIE 
T(N) 的 增长 率 小 于 (之 }p(NN) 的 增长 率 . 它 不 同 于 大 O. 因为 大 O 包含 增长 率 相 同 这 种 可 
能 性 。 

为 了 证 明 某 个 函数 TON) OUND, 我 们 通常 不 是 形式 地 使 用 这 些 定义 , 而 是 使 用 -一 
些 已 知 的 结果 ,一般 说 来 , 这 就 意味 着 证 明 ( 或 确定 假设 不 成 立 ) 是 非常 简单 的 计算 并 不 涉及 
微 积分 , 除非 遇 到 特殊 的 情 襄 (不 可 能 发 生 在 算法 分 析 中 ): 

当 我 们 说 TON) = OCFOND it, 我 们 是 在 保证 函数 了 CN) 是 在 以 不 快 于 A(N) 的 速度 增 
长 ; 因此 FON) FE TON) — EX (upper bound). 与 此 间 时 ，f(N) — QCTCNDD) BRA 
TON) FE FON) — TF I ower bound )。 

作为 一 个 例子 ，N3 增长 比 NT 快 ， 因 此 我 们 可 以 说 N = OCN? aR ON? = Q0N7), FOND) 
= NM 和 gw)J=2N2 以 相同 的 速率 增长 , 从 而 FON) = OC (ND) FON) = (gg NDARE 
正确 的 。 当 两 个 函数 以 相同 的 速率 增长 时 , Rmus Be ICS "80" Raa BER MT REIS 
上 下 文 。 直 疯 地 说 , 如 果 gf(N)=2N2, ABA gUN) - ON), g(N)= OC(NP) RI g(N) = 
OUN2) 从 技术 上 看 都 是 成 立 的 , 但 最 后 一 个 选择 是 最 好 的 答案 。 写 法 g(N)= ON DAR 
A g(N) = OUON2) 而 且 还 表示 结果 会 尽 可 能 地 好 (严密 )。 

我 们 需要 掌握 的 重要 结论 为 ; 

法 则 t: 

如 果 TON) = OC FCN) EB T20N)  OCgCND), ABA 

(a)T,(N) + T20N)=max(OCf(N)), OCZON))), 

(b) TUN) * T4UN) OLEN)» gU ND). 


法 则 2: 
如 果 TON) EA k 次 多 项 式 , 则 T(N)- CN), 
法 则 3: 


EPH k, lopg* N = O(N)。 它 告诉 我 们 对 数 增 长 得 非常 缓慢 。 

这 些 信 息 足 以 接 照 增长 率 对 大 部 分 常见 的 哺 数 进行 分 类 ( 见 7 
图 2-1)。 

现在 指出 几 点 注意 。 首 先 , 将 常数 或 低 阶 项 放 进 大 O 是 非常 
坏 和 的 习惯 ,不 要 写成 T(N}= OC2N7) 8 TUN) = OCGN^- N), 在 
这 两 种 情形 下 , 正确 的 形式 是 T(N) = O(N?)。 这 就 是 说 , 在 知 
要 天 表示 的 任何 分 析 中 ,各 种 简化 都 是 可 能 发 生 的 。 低 阶 项 一 
般 可 以 被 忽 路 ,而 常数 也 可 以 和 弃 掉 。 此 时 ,要 求 的 精 魔 是 很 低 的 。 

第 二 , 我 们 总 能 够 通过 计算 极限 lim FCN) /g (NRA EBT 图 2-1 典型 的 增长 率 
PR FON) RI g(N) 的 相对 增长 率 ， 必要 的 时 候 可 以 使 用 洛 必 达 法 则 。 该 极限 可 以 有 了 下 种 可 
能 的 值 ; 

。 极限 是 0; 这 意味 着 FUN) = oC g COND) « 

。 极 限 是 。 关 0: 这 意味 着 (CN) = OCR UND: 





cO» HERATSNICL! Hopital’ s rule) if & A hm (N) = 99 R. lim x CN) - wo, 则 im FCN) Zg (ND = Tim FNMg' 
EN), 而 六 CN) 和 (NN) 分 别 足 AN} 和 gtN) 的 导数 。 


© 极限 是 ooe ;这 意味 着 BN) — oCFUND). 

© 极限 摆动 :二 者 无 关 ( 在 我 们 的 书 中 将 不 会 发 生 这 种 情形 ) 

使 用 这 种 方法 几乎 总 能 够 算出 相对 增长 率 。 通 各 ,两 个 果 数 FOND FI eg CONO BIB S A RI 
VISAS RE 344589 58. Glin, E F(N)- N legN Hig( ND) — N'^. 那么 确定 FUNDI 
CONORTAR KEI, 实际 上 就 是 确定 log N UNT OWE PS eR. xx Gf E log N MN 
喔 个 增长 更 快 是 一 样 的 , 而 后 者 是 个 简单 的 问题 ,因为 我 们 已 经 知道 ，N R R ERF logN 
(SE BRE. 因此 ，g CN) 的 增长 快 于 并 和 N) 的 增长 . 

另外 ,在 风格 上 还 说 注 意 ; REB FONOS OCN) Ane MU She E Sa 
F.H FON)ZSO(C NERAN], ERMA XL 


2.2 模型 


为 了 在 正式 的 框架 中 分 析 算 法 ,我 们 甫 可 一 个 计算 模型 。 我 们 的 模型 基本 上 契 - .人 对 标准 
的 计算 和 机， 在 初 器 中 指令 被 顺序 地 执行 .该 模型 有 -个 标准 的 简单 指令 系统 , WANA REA, 
比较 和 峰值 等 , 但 不 同 于 实际 计算 机 情况 的 是 , 模型 机 做 任 一 件 简单 的 工作 部 恰好 花 寓 一 个 
时 间 单 元 。 为 了 合理 起 见 , 我 们 将 假设 我 们 的 模 霸 像 一- 台 现 代 计 算 机 那样 有 固定 范围 的 整数 
(比如 32 个 比特 ) 并 且 不 存在 诸如 盾 阵 求 北 或 排序 等 运算 , 它们 显然 不 能 在 一 个 时 间 单 位 内 
完成 . 我 们 还 假设 模型 机 有 无 限 的 内 存 。 

显然 , 这 个 模型 有 些 缺点 。 很 明显 , 在 现实 生活 中 不 是 所 有 的 运算 部 恰好 化 费 相同 的 时 
特别 地 .在 我 们 的 槛 型 中 , 一 次 位 总 读 人 记 时 间 一 次 加 法 , 虽然 加 法 ~- 般 要 快 几 个 数量 
级 ,。 还 有 , 由 于 假设 有 无 限 的 存储 , 我 们 再 不 用 拒 心 缺 页 中 断 , 它 可 能 是 个 实际 问题 , 特别 是 
对 商 效 的 算法 : 


2.3 要 分 析 的 问题 


要 分 析 的 最 重要 的 资源 一 般 说 来 就 是 运行 时 间 。 有 几 个 内 素 影 响 着 程序 的 运行 时 间 。 有 
此 因素 如 所 使 用 的 编译 器 和 计算 机 显然 超出 了 任何 理论 模型 的 范畴 , 因此， 虽然 它们 是 重要 
的 , 但是 我 们 在 这 蛙 还 不 能 处 理 它们 。 剩 下 的 主要 因素 则 是 所 使 用 的 算法 以 及 对 该 算法 的 
HA 

典型 的 情形 是 , 输入 的 大 小 是 主要 的 考虑 方面 。 RE LT BH Tuy (N) 
T. UND, 分 别 为 输入 为 N 时 ,算法 所 花费 的 平均 运行 时 间 和 最 坏 情况 下 的 运行 时 间 , 显 
R, Tag NYS Tuus (NDS 如 果 存在 更 多 的 输入 , 那么 这 些 函 数 可 以 有 更 多 的 变量 。 

_ Ae. 车 无 相反 的 指定 , 则 所 需要 的 量 是 最 坯 情况 下 的 运行 时 间 。 其 原因 之 -是 它 
对 所 右 的 输入 提供 了 一 个 界限 ,包括 特别 坏 的 输入 ,而 平均 情况 分 析 不 提供 这 样 的 界 另 一 
个 原因 是 平均 情况 的 四 计算 起 来 通常 要 几 难 得 多 。 在 某 此 情况 下 ,“ 平 均 ” 的 定义 可 能 影 喇 分 
析 的 结果 。( 例 如 . 什么 是 下 述 问题 的 平均 输 人 ?) 

作为 -个 例子 , 我们 将 在 下 - - 节 考 虑 下 述 问 题 : 
最 大 的 子 序列 和 问题 : 

给 定 整数 AL, Ay, -.., Ax CHEER TURO k 222 A MEK (为 方便 起 见 , 如 内 所 


Xj ORCI Du GC, 则 最 大 子 序列 和 为 0). 


Eur 


(48; 


FEE: 


fni : 

输入 一 2, 11, -4, 13, —5, -2 时 , 答案 为 20( 从 A; 到 Az), 

这 个 问题 所 以 有 了 暴 引 力 , 主要 是 因为 存在 求解 它 的 很 多 算法 , 而 这 些 算法 的 性 能 义 差 异 
RA. 我 们 将 讨论 求解 该 问题 的 四 种 算法 。 这 四 种 算法 在 某 台 计算 机 上 (究竟 是 哪 一 台 具 体 
的 计算 机 是 不 重要 的 ) 的 运行 时 间 在 图 2-2 给 出 。 


0.00066 0.00034 


0,004386 0.DD063 
0.05843 0.00333 
0.58631 0.03042 
8.0113 0.29832 





图 2-2 计算 最 大 于 序列 和 的 几 种 算法 的 运行 时 间 ( 秒 ) 


表 中 有 几 个 重要 的 情况 值得 注意 。 对 于 小 量 的 输入, SHEAR aS a, ASU A de 
小 量 输入 的 情形 , 那么 花费 大 量 的 努力 去 设计 聪明 的 算法 怒 怕 就 太 不 值得 了 。 为 一 方面 , 近 
来 对 于 重 写 那些 不 再 合理 的 基于 小 输入 量 假设 而 在 五 年 以 前 编写 的 程序 确实 仓 在 寿 巨 大 的 市 
场 。 现 在 看 来 , 这 些 程序 太 慢 了 , 因为 它们 用 的 算法 不 是 好 算法 。 对 于 大 晨 的 输入 , 算法 4 显 
然 是 最 好 的 选择 (虽然 算法 3 也 是 可 用 的 )。 

其 次 ,， 表 中 所 给 出 的 时 间 不 包括 读 人 数据 所 需要 的 时 间 。 对 于 算法 4, 仅仅 从 伐 盘 该 人 
数据 所 用 的 时 间 很 可 能 在 数量 级 上 比 求解 上 述 问题 所 需要 的 时 间 还 要 太 。 这 是 许多 有 效 算法 
中 的 典型 特点 。 数据 的 读 入 一 般 是 个 瓶 翁 ; 一 日 数据 读 人 , 问题 就 会 迅速 解决 但 是 , 对 于 低 
效率 的 算法 情况 就 不 同 了 , 它 必 然 要 耗资 大 量 的 计算 机 资源 。 因 此 只 要 可 能 , 使 得 算法 足够 
有 效 而 不 致 成 为 问题 的 瓶 堪 是 非常 重要 的 。 

图 2.3 指出 这 四 种 算法 运行 时 间 的 增长 举 。 尽管 该 图 只 包含 N 从 10 到 100 BR, 但 是 
相对 增长 率 还 是 很 明显 的 。 虽然 算法 3 的 图 看 起 来 基线 性 的 , 但 是 用 一 把 直 尺 (或 是 一 张强 ) 
容易 验证 它 并 不 是 直线 。 图 2-4 显示 对 于 更 大 值 的 性 能 。 该 图 戏剧 性 地 描述 击 ， 即 使 输入 量 
的 大 小 是 适度 的 , 低 效 算法 依旧 无 用 。 
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图 2.4 SABA CEPR OH NW 
2.4 运行 时 间 讨 算 


有 用 种 方法 估计 一 :个 程序 的 运行 时 间 。 BI EE EA SBS. 如 果 两 个 程序 花费 的 
时 间 大 致 相同 , 要 确定 哪个 程序 更 快 的 最 寻 方 法 很 可 能 就 是 将 它们 编码 并 运行 ! 

Wea, 存在 几 种 算法 思想 , 而 我 们 总 愿意 尽早 除去 那些 不 好 的 算法 思想 , 因此 , RS 
需要 对 算法 进行 分 析 。 不仅 如 此 , 进行 分 析 的 能 力 太 有 助 于 洞察 到 如 何 设计 和 有 有效 的 算法 。-- 
般 说 来 ,分 析 还 能 准确 确定 需要 什 细 织 码 的 报 领 - 

为 了 简化 分 析 , 我 们 将 采纳 如 下 的 约定 :不 存在 特定 的 时 间 单 位 。 因此 , RMR. 
我 们 还 将 抛弃 低 阶 项 ， 从 而 我 们 要 做 的 就 是 计算 大 O 运行 时 间 。 由 于 大 O 是 -- 个 上 界 . 因 
此 我 们 必须 仔细 ,， 绝 不 要 低估 程序 的 运行 时 间 -。 实际 上 , 分 析 的 结果 为 穆 序 在 一 定 的 时 问 范 
于 内 能 够 终止 运行 提供 了 保障 。 程序 可 能 提前 结束 . 但 绝 不 可 能 拖 后 。 

2.4.1 一 个 简单 的 例子 
这 里 是 计算 SD” RPE: 
ini 
Sum int N 3 
{ 
int 3, PartiatSum; 


fe lI") PartialSum = 0; 


fr Qj forlì = 1; d <= Ħ; i++ } 
fr 3*/ PartialSum += i * 7 * i; 
ft 4*/ return PartialSum; 

} 


对 这 个 程序 的 分 析 很 简单 。 声明 不 计时 间 。 第 1 行 和 第 4 TST oc, 95 313 
每 执行 -次 占用 四 个 时 间 单 元 (两 次 乘法 ,一 次 加 法 和 一 次 赋值 ), 而 执行 N DOES ANT 
时 间 单 元 .第 二 行 在 初始 化 二 测试 ISN 和 对 i 的 自 增 运算 中 隐 含 着 开销 。 ADAE E 
销 蚌 初始 化 1 个 时 间 单元 , 所 有 的 测试 N 1 | 个 时 间 单 元 , 以 及 所 有 的 白 增 运算 N 个 时 同 单 
35. THIN + 2, 我们 忽略 调用 函数 利 返 口 什 的 井 销 ， (Sa) MELON t4, 因 此, Ril bee 
是 ON). 

如 果 我 们 每 次 分 析 一 个 程序 都 要 演示 所 有 这 些 工 作 , 那么 这 项 任务 很 快 误会 变 成 个 al ay 


| 
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KIC. SBN, 由 于 我 们 有 大 OKER, 因此 就 存在 许多 可 以 采取 的 捷径 并 册 不 影响 
最 后 的 结果 , 例如 , 第 三 行 ( 每 次 执行 时 ) 显 然 是 OY, AUIS COTE. oe 
是 四 个 时 间 单 死 大 思春 的 ; 这 无 关 紧 要 。 第 一 行 与 fcr 循 环 相 比 显然 是 不 重要 的 , 所 以 在 这 里 
花费 时 间 也 是 不 明智 的 。 这 使 得 我 们 得 到 大 干 -一 般 法 则 。 
2.4.2 一 般 法 则 

法 财 1 一 一 FOR f835: 

一 次 for 社 环 的 运行 时 间 至 多 是 该 for 循环 内 语 自 (包括 测试 ) 的 运行 时 间 来 以 选 代 的 

[21] 次 数 。 

法 则 2— —EE TER) for TAM 

A e So pix GE ERR, UE I e E ER A SES RS 6) a iE TR IR] AE ARIS 61 WIRT 
时 间 乘 以 该 组 所 有 前 for Ee X rb e XR. 

作为 一 个 例 于 , 下 列 程序 片段 为 OCN?): 


for( i= 0; i < N; i++ 3 
fort j = 0; j < M; j++ 2 


ktts 

法 则 3 一 顺序 语句 

将 各 个 语句 的 运行 时 间 求 和 即 可 (这 意味 着 ， 其 中 的 最 大 值 就 是 所 得 的 运行 时 间 ; 见 2.1 
节 的 法 则 1(a))。 

作为 一 个 例子 , FEARS BERI O(N) ,再 花费 OCN?) ,总 的 开销 也 是 O(N2) 


fort i = 0; i <N; i++ ) 
AT i 7 = 9; 


法 则 4 IF/ELSE i& f] 
wy TAZ AB a 


ifi Condition ) 
51 





else 
a2 


一 个 jeise 语 身 的 运行 时 间 从 不 超过 判断 再 加 上 51 和 S2 中 送行 时 间 长 者 的 总 的 运行 
时 间 - 

虽然 在 某 些 情形 下 这 么 估计 有 些 过 高 , 但 绝 不 会 估计 过 低 。 

其 他 的 法 则 都 是 显然 的 , 但 是 ， 分 析 的 基本 策略 是 从 内 部 (或 最 深层 部 分 } 向 外 展开 的 。 
如 果 有 函数 调用 , 那么 这 些 调用 要 首先 分 析 。 如 果 有 递归 过 程 , 那么 存在 几 种 选择 。 右 迪 归 
实际 上 只 是 被 薄 面 纱 迹 住 的 for 循环 , 则 分 析 通 常 是 很 简单 的 。 例如 , 下面 的 函数 实际 上 就 在 
- -个 简单 的 循环 ， 从 而 其 运行 时 间 为 OCN): 


long int 
Factorial( int N ) 
{ 
iff N <= 1) 
return i; 
else 
return N * Factorial( M - 1); 
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循环 结构 是 相当 国难 的 ， 在 这 种 情况 下 , 分 析 将 涉及 求解 -- 个 衣 推 夫 系 。 为 了 观察 到 这 种 可 
能 发 生 的 情形 ,考虑 下 列 程序 , Kir EENEI E HIRIRA RIE 
long int 
Fib€ int N 3 
fe 1*/ MCN c= 1) 
fe aes return 1; 


else 
ft 3j return Fibl N - 1 3 + Fbi N- 2 4; 
i 


HARE. BAFER EHER RAR. WE, up E eS, MREP N 大 约 
30 的 值 并 运行, 那么 这 个 程序 让 人 感到 效率 低 得 吓人 .分 析 十 分 简单 . 今 TUON) AAR 
b(tN) 的 运行 时 间 , 如 果 N=O Re N= 1, Jui tee E EE. 即 第 - 行 上 做 判 新 以 
此 返回 所 用 的 时 间 。 因为 常数 并 不 重要 ,所 以 我 们 可 以 说 TO= T{1}=1. MPN 的 其 他 
值 的 运行 时 间 则 相对 竹 基 准 情形 的 运行 时 间 来 度 电 , 若 N > 2. 则 执行 该 了 数 的 时 间 是 入 一 
行 上 上 的 常数 工作 如 上 第 三 行 上 的 下 作 . 第 二 行 由 一 次 所 法 和 两 次 国 数 调用 组 成 , HI FP iad] 
用 不 是 简单 的 运算 ， 必 须 通 过 它们 本 匡 来 分 析 。 第 - -次 好 数 调用 是 Fib tN 一 1), 从 而 按照 了 
HEL, ERE TON -1 个 时 间 单 元 .类似 的 论证 指出 , BOA RR AA tN 一 2) 个 
有 时间 单元 。 此 时 总 的 时 间 需 求 为 TUN D+ T(N-2) &2. 其 中 "2” 指 的 是 第 -- 行 于 的 志 作 
th EAS cfr RAE. 于 是 对 于 N 空 2 我 们 有 下 列 闫 于 Fib NOBQETIBPIZIE 

T(/N)- T(N-)) ! T(ÍN-20-2 

但 是 MACN) = Fib(N — 1) - Fib( N- 22, 因此 由 归纳 法 容易 证 明 TON) FibCN). 在 
1.2.5 节 我 们 证 明 过 FIBCN) « 73)", 类似 的 计算 可 以 证 明 ( 对 于 NN > 4) FIBCND ZR 
2 时 见 ， 这 个 程序 的 运行 时 间 以 指数 的 速度 增长 , 这 大 致 是 最 不 的 情况 ,通过 人 殿 留 一 个 衣 
第 的 数组 并 使 用 . -个 for 循环 ,运行 时 间 可 以 被 实质 性 地 减少 下 来 、 

这 个 称 序 之 所 以 缓慢 、 是 因为 存在 大 量 多 余 的 工作 要 做 ,违反 了 和 奉节 1.3 P SUR S 3 
的 第 四 条 主要 的 法 则 (合成 效益 法 则 )。 注意 , 在 第 二 行 上 的 第 - :次 调用 即 FibON 一 上) 实际 二 
HET FIbCN-2), 这 个 信息 被 抛弃 而 在 第 三 行 上 的 第 二 次 调 内 时 又 重新 计算 了 一 这 MF 
的 信息 量 递 妇 地 合成 起 来 并 导 孝 巨大 的 运行 时 间 ., 这 战 许 是 属 言 “计算 任何 事情 个 要 起 过 一 
次 ”的 最 好 的 实例 , 但 它 不 应 使 你 被 中 得 远离 递 11 而 不 地 使 用 它 : 本 书 中 我 们 将 随处 看 到 弟 
归 的 出 色 的 使 用 。 
2.4.3 最 大 子 序列 种 问题 的 解 

现在 我 们 将 要 叙述 四 个 算法 来 求解 早先 提出 的 最 大 子 序 列 和 问题 . 第 一 个 算法 在 图 2.5 
中 表述 , 它 只 是 穷 举 式 地 尝试 所 有 的 可 能 . for 循环 中 的 循环 变 大 反映 (中 数组 从 1 开始 而 二 
是 从 1 开始 这 样 一 个 事实 。 再 有 ,本 算法 并 不 计算 实际 的 子 序 亿 ; SLEEP ERST 一 二 
Bul bY A? 

该 算法 肯定 会 正确 运行 (这 不 应 该 花 太 多 的 时 间 具 证 内) 运行 时 间 为 OCN?), xx Se ek 
决 于 第 5 行 和 第 6 行 , BoE- TAT HERE for HTH 0 (1) 语句 组 成 , 88 2 fT E88 
循环 大 小 为 N: 

第 2 个 循环 大 小 为 Ni, 它 可 能 要 小 , 但 也 可 能 是 N. 我 们 必须 假设 最 坏 的 情况 ,| 而 这 
可 能 会 使 得 最 终 的 界 有 些 大 。 第 3 个 循环 的 大 小 为 了 -了 + 我 们 世 要 假设 它 的 大 小 为 N, 
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因此 总 数 为 OUPCN-N-N)- ON), 语句 1 总 共 的 开销 只 是 0(1), TERI 7 和 8 总 共 开 
销 也 只 不 过 O(N?)， 因为 它们 只 是 两 层 循环 内 部 的 简单 表达 式 。 



















int 
MaxSubsequenceSum( const int AL J], int N 2 


int ThisSum, MaxSum, 1d, j, K; 





MaxSum = D; 


fe Oy fort i = 0; ix N: in) 
po f® Bef for( j= i; j « N; j++ 3 
1 
f* A ThisSum = 0: 
f* Sy for( k = i; k <= j; k++ 3 


ThisSum += AL k 7; 


if ThisSum > MaxSum ) 
Maxsum = ThisSum: 


} 
return Maxŝum: 





} 


图 2-5 算法 1 


事实 上, 考虑 到 这 些 循 环 的 实际 大 小 , 更 精确 的 分 析 指 出 答案 是 GUNT), 而 我 们 上 而 的 
估计 高 出 个 因子 6( 不 过 这 并 无 大 碍 , 因为 常数 不 影响 数量 级 )。 一 般 说 来 , 在 这 类 问题 中 上 
述 结论 是 正确 的 。 精确 的 分 析 由 和 007 02] Soi 14880, 该 和 指出 程序 的 第 6 行 被 执 
行 的 次 数 。 使 用 1.2.3 节 中 的 公式 可 以 对 该 和 从 内 到 外 求 值 。 特别 地 , 我 们 将 用 到 前 N 个 束 
数 求 和 以 及 前 N 个 平方 数 求 和 的 公式 。 首 先 我 们 有 


接着 , 我 们 得 到 


Sys jist 
E—i 


3I ~74D= CN EDN i) 


这 个 和 数 是 对 前 N - i 7 个 整数 求 和 而 算得 。 为 完成 全 部 计算 , 我 们 有 
Y (N= i+ DON =) E S (N-i+1)(N-i+2) 
i- - i=] 2 


N N N 
1 - (N +3) iri NN +2997 1 
=] 1 r=1 


N(IN+DGN 11 - (w+ ZAAD NAINA 2y 


ON? 4+ 3N%4+2N 
E 6 


我 们 可 以 通过 撤除 一 个 for 循环 来 避免 立方 运行 时 间 , 不 过 这 不 总 是 可 能 的 , 在 这 种 悄 
况 下 算法 中 出 现 大 量 不 必要 的 计算 。 纠 正 这 种 低 效率 的 改进 算法 可 以 通过 观察 Ae = 
ADT A 而 看 出 , 因此 算法 1 中 第 5 行 和 第 6 行 上 的 计算 过 分 地 耗 时 了 。 图 2-6 指出 一 


种 改进 的 算法 。 算 法 2 显然 是 OCN?); 对 它 的 分 析 甚 至 比 前 面 的 分 析 还 简单 。 


对 这 个 问题 有 一 个 递归 和 相对 复杂 的 O(N logN) 解 法 , 我 们 现在 就 来 描述 他。 要 是 真 的 





int 
MaxSubSeguencesSum( const int AL ], int h ? 


| 

| 

| i 

| int ThisSum, Maxsum, 1. 5; 
| 

| 


ÁÓS it MaxSum = O 

fv ae for€ i = 0; 7 e NM; des 3 | 
QU YF ThisSum = 0; | 
fe avs forg j =a: j < Ni j++) ! 
i | 
| fe Gr ThisSum -= Ai d ft ， 
| 1 
A By iff ThisSum > Maxsum j) | 
| fe FF MaxSum = Th?s&um; i 
| ' i 
! | 

| /* Be return MaxSum: 

i 
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MEHL OUNj( 线 性 的 ) 解 法 ， 这 个 算法 就 会 是 体现 递归 威力 的 极 好 的 范例 了 该 方法 采用 
Bp órifitdivide-and-conquer)" ER. Hos LEE oy 888 p P T ACE ASA P RI. SA ID a LI 
nog JSR. axi a Ra. u^ BA BEE BY > T ER BP tepi H] REHE TP S 
BST E. Hx PEE T oe E 

在 我 们 的 的 子 中 . 最 大 子 序列 和 可 能 在 三 处 出 坝 - 或 者 更 个 出 现在 输入 数据 的 大 于 部 ， 
mE 4g EE, 或 者 跨越 输 人 数据 的 中 部 从 而 凸 所 左右 两 半 部 分 : 前 两 各 情况 可 以 
递归 求解 第 三 种 情况 的 最 大 和 可 以 通过 求 出 前 半 部 分 的 最 大 和 (包含 前 半 部 分 的 最 后 一 个 
元 索 ) 以 及 后 半 部 分 的 最 大 和 (包含 后 半 部 分 的 第 一 个 元 葵 ) 而 得 到 . 然后 将 这 两 个 利加 下 
起 作为 一 个 例子 ， 考虑 下 列 输入 : 


前 半 部 分 O RABA 
d —1 à E - | à n 


此 中 前 半 部 分 的 最 天 子 序 列 和 为 6( 从 元 素 A88 A D ERA RAT Tr PURUS: BC Mt 
3X A, FAs). 

MDE BAFIL HEUS PICK WBA ALE AATA A, 到 A4). uii RIBS) fl N 
个 匹 率 的 最 天 和 是 7 NOt As 到 As). AR. 横路 这 两 部 分 及 道 过 中 全 的 最 太 和 为 4+7=11 
(Moca A, 到 Az). 

我 们 看 到 ,在 生成 本 例 中 最 大 子 序 别 和 的 二 种 方法 中 , 最 好 的 方法 起 包含 两 部 分 的 元 
# 十 是 , 等 案 为 11。 图 2-7 提 出 了 这 种 策略 的 一 种 实现 于 段 ; 

右 必要 对 算法 3 的 程序 进行 一 些 说 明 , 递 申 过 程 油 用 的 一 般 蕊 式 是 传递 输入 的 煞 组 以 从 
大 (let 边界 和 右 fright) 边 界 ,它们 和 愉 定 了 数组 要 第 处 理 的 部 分 : LET BUS] E SD P CH. 
VL REO GRIN 一 1 而 启动 该 过 程 ， 

第 1 行 至 第 4 行 处 理 基准 情况 。 ME Left = = Right, 那么 只 有 一 个 元 素 , 并 上 于 该 元 
素 非 负 时 它 就 是 最 大 和 了 序列. Left > Right 的 情况 是 不 可 能 出 规 的 , 除非 N 是 负数 (不 
aE. 程序 中 的 小 的 挑动 有 可 能 敏 使 这 种 混乱 产 咎 )。 第 6 行 和 第 ? 行 执行 两 次 递归 调用 。 我们 
TUES, BAS b+ Ra BET, (ALPE FE re cde oft FF aT f QR ix Tj 
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static int 

faxSubSum const int AL T, int Left, int Right ) 

int MaxLeftSum, MaxRight5um; | 
int MaxLeftBorderSum, MaxRightBorderSum; 

int LeftBordgrSum, RightBorderSum; 

int Center, 7; 







/* 1*/ if( Left == Right ) /Ar Base Case */ 
f* 2*/ ifC AE Left] > 0) 
A 3*f/ return A( Left 7: 
else 

fe anf return 0; 
/* $*/ Center = ( Left + Right ) / 2; 
ft &*/ MaxLeftSum = MaxSubSum( &, Left, Center ); 
y" Ty MaxRightSum — Max5ubS5um( A, Center + 1, Right 3; 
/* B*/ MaxLeftBorderSum = 0; iLeftBerder5um = 0 
/* 9*/ for( i = Center: i >= Left: i-- ) 

{ 
/*10*/ LeftBordersum += Àj i ]; 
ft, ift LefrBordersum > MaxLeftBorderSum ^ 
/*12*/ MaxLeftBorderSum = LeftBorderSum; 

} 
/*13*/ MaxRightBorderSum = 0; RightBorder*sum = D; 
/*14*/ for( 7 = Center + 1; i <= Right; j++ } 

{ 
/*15*/ RightBorderSum += AL i ]; 
/*l6*/ ifi RightBorderSum > MaxRightBorderSum ) 
/*17*/ MaxRightBorderSsum = RightBorderSum; 





} 


/*18*/ return Max3( MaxLeftSum, MaxRightSum, 
/*19*/ MaxLeftBorderSum + MaxRightBorderSum ); 
} 







int 
MaxSubsedquence&um( const int AL ], int N3} 






return MaxsubSum( 4, 0, N - 1); 
} 






图 2-7 算法 3 


性 , 第 8 行 至 第 12 行 以 及 第 13 行 至 第 17 行 计算 达到 中 间 分 界 寻 的 两 个 最 大 和 的 和 数 , 这 两 
个 最 大 和 的 和 为 扩展 到 左右 两 边 的 最 大 和 和。 thA TE ( pseudoroutine) Max3 返回 这 三 个 可 能 的 最 
太 和 中 的 最 大 者 。 

虽然 ,编程 时 ,算法 3 比 前 面 两 种 算法 需要 更 多 的 精力 。 然而, 程序 短 并 不 总 意味 着 程序 
好 。 正 如 我 们 在 前 面 显 示 算法 运行 时 间 的 表 中 已 经 看 到 的 , 除 最 小 的 输入 外 , 该 算法 比 前 两 
PRE BRR, 

EE al i4 ELA ESEA SE a PR TON ) 是 求解 大 
小 为 N 的 最 大 子 序 列 和 问题 所 花费 的 时 间 。 如 果 N= 1, 则 算法 3 执行 程序 第 11752955 4 13 
ERESHE, 我 们 称 之 为 一 个 时 间 单 元 。 FE, TOS !。 否则 , 程序 必须 运行 两 次 过 
归 调 用 , 即 在 第 9 行 和 第 17 行 之 间 的 两 个 for 循环 , 还 需 某 个 小 的 夭 记 其 ,如 在 第 5 行 和 第 
18 行 。 这 两 个 for 循环 总 共 接 触 到 从 Ay 到 Aw-1 的 每 一 个 元 素 , 而 在 循环 内 部 的 工作 量 是 常 
ER. 因此 , 在 第 9 到 17 行 花费 的 时 间 为 O(N)。 第 1 行 到 第 5 行 ,第 8、13 和 和 18 行 上 的 程序 
的 工作 量 都 是 常量 , 从 而 与 OCN) 想 比 可 以 忽略 。 其余 就 是 第 6、7 行 上 运行 的 工作 。 x HT 


Jm X 21 
求解 大 小 为 N72 的 子 序 列 问题 { 假 没 N 是 偶数 )。 因此 , 这 两 行 每 行 化 费 TON /2) 个 时 间 单 
Ju. SEAR 27TCN /2D 个 时 间 单元 算法 3 花费 的 总 的 时 间 为 2TCNA2) + OCND 我 们 得 到 
方程 组 

T(i) =1 
TON) = 2TON/2) + O(N) 

为 了 简化 计算 , 我 们 可 以 用 NRE PR OCN ST, 由 于 TOCN) 最 终 还 是 要 用 大 
来 去 示 的 ,因此 这 么 做 并 不 影响 答案 , 在 第 7 E. 我 们 将 会 看 到 如 和 何 严格 地 求解 这 个 方程 . 
至 于 现在 ,如 时 TON) =2T(N/2)4+N, A T(D -1. WA 1(2) 74-72 * 2. T(4) 212-7 
4 * 3. T(8) 232-28 * 4, UR 1(16) - 80 716 « 54 HBR BRAT A]. ED 
4: N=2*, MW TCN) 2 N x (2+ DD N log NN OCXN log N). 

MTOR N 是 偶数 , 因为 否则 N2 就 不 确定 卫 。 通过 该 分 析 的 递归 性 质 可 知 ,， 实 
REHA N 十 2 BEH, SRR CHA, 否则 我 们 晤 终 要 员 到 闫 小 不 是 偶 数 的 子 问题 ， 
方程 就 无 效 了 。 当 NN 不 是 2 的 每 的 时 候 , 我 们 多 少 需 上 要 上 出 加 复杂 一 些 的 分 析 , TH REA O 的 结 
果 是 不 变 的 。 

在 后 面 的 章节 中 , 我 们 将 看 到 递归 的 几 个 淖 亮 的 应 用 。 这 里 , 我 们 还 是 介绍 求解 最 大 于 
序列 和 的 第 四 种 方法 , 该 算法 实现 起 来 要 比 递归 算法 简单 而 日 喝 为 有 效 - 它 在 图 2 8 中 


给 出 
int 
MaxSubsequenceSum( const int AL ], int N3 i 
{ | 


| tnt ThisSum, MaxSum, j: 


f* 1*7 ThisSum = MaxSum = 0; 


f* gy forg j 20: J e N; j++} 
1 
A ThisSum += AL j ]; 
fe aes iff Thissum > MaxSum jJ 
f* oy MaxSum = This*um: 
f* Br else ifi ThisSum < O } 
fe eee TrisSum = Q: 
| f* 8*/ return MaxSum; 
| } 
图 2-8 算法 4 


不 难 理 解 为 什么 时 间 的 界 是 正确 的 , 但 是 要 明白 为 什么 算法 是 下 兢 吕 行 的 会 费 些 思考 ; 我 
们 把 它 留 给 读者 去 完成 . 该 算法 的 一 个 附带 的 优点 是 , 它 只 对 数据 进行 一 次 扫描 . — B 4[ 被 
读 人 并 被 处 理 , 它 就 不 再 需要 被 记忆 。 因 此， 如 果 数 组 在 磁盘 或 磁带 上 , 它 就 可 以 被 顺序 起 人， 
在 主 存 中 不 必 存 储 数 组 的 什 何 部 分 。 不仅 如 此 , 在 任意 时 刻 , 算法 都 能 对 它 已 经 读 入 的 数据 给 
出 子 序 列 间 题 的 正确 答案 (其 他 算法 不 具有 这 个 特性 )。 只 有 这 种 特性 的 算法 叫做 联机 算法 (or 
line algorithm)。 仅 需要 常量 空间 并 以 线性 时 间 运 行 的 在 线 算法 几乎 是 完 天 的 算法 。 
2.4.4 ”运行 时 间 中 的 对 数 

分 析 算法 最 混乱 的 方面 大 概 集中 在 对 数 上 面 。 我 们 已 经 看 到 ， 某 些 分 治 算法 将 以 O(N 
log N) 时 间 运 行 , 除 分 治 算法 外 ， 可 将 对 数 最 常 出 现 的 规律 概括 为 下 列 -. 般 法 则 :如 果 一 个 工 
法 用 常数 时 间 (Of1)) 将 问题 的 大 小 削减 为 其 一 部 分 (通常 是 172)， 那 么 该 算法 就 是 O(log 
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N)。 另 一 方面 , 如 果 使 用 常数 时 间 只 是 把 问题 减少 一 个 常数 (如 将 问题 减少 1), 那么 这 种 算 
法 就 是 O 〇 O(N) 的 。 

显然 ,只 有 一 些 特殊 种 类 的 问题 才能 够 呈现 出 Oo N) BY, 例如, 车 输入 NN 个 数 , 则 一 个 
算法 只 是 把 这 些 数 评 人 就 必须 耗费 QCN) 的 时 间 其 。 因此 ， 当 我 们 谈 到 这 类 问题 的 Oog N) 算 
法 时 , 通常 部 是 假设 输 和 人 数据 已 经 提前 读 人 -. 我 们 提供 彼 有 对 数 特点 的 王 个 例子 ， 
对 分 查找 

第 一 个 例子 通 贡 吗 做 对 分 查找 (binary search) ; 
对 分 查找 : 

给 定 一 个 整 教义 Fed AE AY, Al, ..., Ax- 上 局 者 已 经 预先 排序 并 在 内 疮 中 ,未 使 得 
六 ,二 六 的 下 标 i， 如 果 X 不 在 数据 中 ， 则 返回 1 二 一 1，; 

明显 的 解法 是 从 堪 到 右 扫 描 数 据 ， 其 运行 花费 线性 时 间 - 然而 , 这 个 算法 没有 用 到 该 表 
己 然 排 学 的 事实 ,这 就 使 得 算法 很 可 能 不 是 最 好 的 。 一 个 好 的 策略 是 验证 X 是 否 是 居中 的 元 
zt. 如果 是 ， 则 答案 就 找到 了 . 如 果 X 小 于 居中 元 素 . 那么 我 们 可 以 庶 用 同样 的 策略 于 居中 
元 素 左 过 已 排序 的 子 序列 ; AA, 如 果 X 大 于 届 中 元 素 , 那么 我 们 检查 数据 的 右 半 部 分 .也 
存在 可 能 会 终止 的 情况 。) 图 2-9 列 出 了 对 分 查找 的 程序 (其 答案 为 Mid)- 图 中 的 程序 反映 了 
CC 语言 数组 下 标 从 0 开始 的 惯例 。 


int 
BinarySearch( const ElementType AL J, ElementType X, int NO 
1 


int Low, Mid, High; 





| fe ity Low = 0; High = N - 1; | 
f* 2*/ whilet Low «= High ) 
{ 
fe gy Mid - € Low + High 5 / ži 
ft 4*/ ifC AL Mid ] < X ) 
Jt 5*7 Low = Mid + 1; 
， else 
| fn 6" ifC AF Mid 1 > X2 | 
f* P High - Mid - 1; 
glse 
/* Bt return Mid; /* Found */ 
] 
/* i return NotFound; /* NotFound is defined as -1 */ | 





图 2.9 对 分 查找 


BR, PRERE AIA LERA Ot1)， 因此 分 析 需 要 确定 循环 的 次 数 . RP 
M High — Low = N — 1 开始 并 在 High — Low 2-1 Ro EKE High- Low 的 值 至 
少将 该 次 循环 前 的 值 折 半 ; 于 是 , 循环 的 次 数 最 多 为 [log(N - 12 1+ 20 (和 例如, £r High 一 
Low — 128, 则 在 各 次 迭代 后 High — Low 的 最 大 值 是 64, 32, 16, 8, 4, 2, 1, 0, -la JA 
此 , 运行 时 间 是 O(log N)。 等 价 地 , 我 们 也 可 以 写 出 运行 时 间 的 递 推 公式 ,个 过 ， 当 我 们 理 
解 实际 在 做 什么 以 及 为 什么 这 样 做 的 原理 时 这 种 强行 写 公式 的 做 法 通常 没有 必要 。 

对 分 查找 可 以 看 作 是 我 们 的 第 一 个 数据 结构 实现 方法 , 它 提供 了 在 O Clog NOB fal P3 89 
Bind( #48 E, 但 是 所 有 其 他 操作 (特别 下 Insert( 插 入 ) 操 作 ) 均 需要 OCN) 时 间 。 在 数据 
是 稳定 ( 即 不 允许 播 人 操作 和 删除 操作 ) 的 应 用 中 ， 这 可 能 是 非常 有 用 的 。 此 时 输 和 人 数据 需要 
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一 次 排 压 . 但 是 此 后 的 访问 会 很 快 , 有 个 例 于 是 一 个 程序 , Eh ER OTE Herh 
CANH RKTL, A ARERIA EH, ASERTITE RIR: TLR eB PARP E 
AR FR. FRARI 110 AR, 因此 找到 一 个 儿 囊 最多 需要 访问 八 次 EEF fr 
TELA ER SVR 
欧 几 里 德 算 法 

第 一 个 例子 是 计算 最 大 会 因数 的 欧 几 里 德 算法 : TS BR AR BR Ged 是 网 时 整 
BEL AAR AKER. FE, Ged (50, 15) - 5. Fd 2-10 中 的 算法 计算 Gel (M,N). RIX 
MIEN. (WRN > M, DIRIA I ECEE i] EH) - 
mH unsigned int | 


Gcd( unsigned tne M, unsigned int N} ; 
1 








unsigned tnt Rem; 


FE 1*/ while( h> 0 3 
i 
/* 2*f Rem - M € M; 
is Be M= Ni 
A A N = Rem; 
/* SJ return M; 


图 2-10 ESLER 

猎 法 通过 连续 计算 余数 直到 余数 是 和 4 为止, 最 后 的 非 零 余 数 就 是 最 大 公 因 数 . 因此 ， 如 
果 M=1989 和 NM=13590, 则 余数 序列 是 399 , 393,6 , 3, 0, 从而, Ged (1989, 1590) 2 3. 
ipn BF Fre dif, 这 是 一 个 快速 算法 

如 前 所 述 , 估计 算法 的 整个 运行 时 间 依 赖 于 确定 余数 序列 究 总 有 多 反 ; ALR log NAW 
理想 中 的 答案 , 但 是 根本 看 不 出 余数 的 值 按照 常数 岗子 递减 的 必然 竹 ， 因 为 我 们 看 人 到 ， 例 中 
的 余数 从 399 仅仅 降 到 393。 事 实 上 ， 在 一 次 近代 中 余数 并 不 按照 一 个 常数 因子 递减 。 FR 
我 们 可 以 证 明 , 在 此 次 迭代 以 后 , 余数 最 多 是 原始 值 的 一 半 。 这 就 证 明了 , 达 代 次 数 至 多 中 
2 log N= Oog N) 从 而 得 到 运行 时 间 ,, EMERE, 因此 我 们 将 它 放 在 这 里 , EA 
列 定 理 百 接 排出 。 

定理 2 1 

WEM > N, HU] M mod N < M/2. 

证 阴 : 

存在 两 种 情形 。 ENSEM Z2, 则 由 于 余数 小 于 N, 故 定 理 在 这 种 情 堪 下 成 立 。 慷 一 种 
情形 是 N > My72。 但 是 此 时 M GUI TN 从 而 余数 为 M- N < M/2, 定理 得 证 。 

从 上 面 的 例 了 来 看 , 2 log N £929 20, 让 我 们 仅 进 行 了 了 次 运算 , 内 此 有 人 会 怀疑 这 是 
不 旦 可能 的 最 好 的 界限 ,。 事实 上 ,这 个 常数 在 最 坏 的 情况 下 (如 MM AN d WT HAE B SERERE 
UB gc a e DL HR PT PA RE 1.44log N 欧 几 里 德 算 法 存 平 均 情 况 下 (HERE T E 
eh ES hal GC en E ROBE HET. HORIS ER REY (12 In2 InN) x7 + 1.47; 
diim 

我 人 在 本 节 的 最 后 一 个 例 了 是 处 理 一 个 整数 的 寡 ( 它 还 是 一 个 整数 )。 Hy Be Fe is FG Fl BY 
Je AAS, 因此, 我们 只 能 在 假设 有 - : 台 机 器 能 够 存储 这 样 一些 大 整数 (或 有 - 
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个 编译 程序 能 够 模拟 它 ? 的 情况 下 进行 我 们 的 分 析 。 我 们 将 用 乘法 的 次 数 作 为 运行 时 间 的 
Hi. 

计算 XN 的 常见 的 算法 是 使 用 N 一 1 次 乘法 自 乘 。 图 2-11 中 的 递归 算法 更 好 。 第 1 行 至 
第 4 行 处 理 基准 情形 。 如 果 N 是 偶数 , 我 们 有 XN = XX"? X". 如果 N EAA, M XN 
xO-D/2, xiN-I72. X. 


Tong int 
Pow( long int X, unsigned in N ) 
i 


return Powt X * X, N / 2 4; 
else 
return Pow( X * X, N / 2)? * Xj 





图 2-11 高 效率 的 取 寡 运算 


例如 , 为 了 计算 xX? ,算法 将 如 下 进行 , ERAS 9 次 乘法 : 

一 (X*)X, X/— (Gy? X, 下 与 三 (Xy X, Xx 一 ( X15)? X, yee - (X?! y 

TR, 所 需要 的 乘法 次 数 最 多 是 2 logN, PROSTETRISUAT AE REA T S RIA (BIR N 左 
奇数 )。 这 里 , 我 们 又 写 出 一 个 递归 公式 并 将 其 解 出 。 简 单 的 直觉 避免 了 盲目 的 强行 处 理 。 

有 时 候 看 一 看 程序 能 够 进行 多 大 的 调整 而 不 影响 其 正确 性 倒是 很 有 意思 的 。 在 图 2-11 
mi 第 3 行 到 第 4 行 实际 上 不 是 必须 的 , 因为 如 果 N 是 1, 那么 第 7 行将 做 回 样 的 事情 。 第 7 
行 还 可 以 写成 

fe Des return Pcw(X, N— 1) * X: 


布 不 影响 程序 的 正确 性 。 事实 上 , 程序 仍 将 以 O(log N) 运 行 , 因为 乘法 的 序列 辣 以 前 一 样 。 
不 过 , 下 面 拆 有 对 第 5 行 的 修改 都 是 不 可 取 的 , 虽然 它们 看 起 来 似乎 部 正确 : 


/* Bat? return Pow( Pow( X, 2), N / 2); 
/* 6b s/ return Pow( Pow(X, N / 2), 2); 
f* 60*7/ return Pow(X, N /2 ) * Fow(X, NR /2 )i 


6a 和 6b 两 行 都 是 不 正确 的 , 因为 当 N 是 2 的 时 候 递 归 调 用 Pow 中 有 一 个 是 以 2 作为 
第 二 个 参数 。 这样, 程序 产生 一 个 无 限 循环 ， 将 不 能 往 下 进行 (最 终 导致 程序 崩溃 )。 

使 用 6c 行 影响 程序 的 效率 , 因为 此 时 有 两 个 大 小 为 N /2 的 递归 调用 而 不 是 -… 个 。 分 析 
指出 , 其 运行 时 间 不 再 是 O(log N). 我 们 把 确定 新 的 运行 时 间作 为 练习 留 给 诬 刹 。 
2.4.5 检验 你 的 分 析 

—B GEH US, 则 需要 看 一 看 答案 是 否 正 懈 ， 是 否 尽 可 能 地 好 。 一 种 实现 方法 是 编 
程 并 比较 实际 观察 到 的 运行 时 间 与 通过 分 析 所 描述 的 运行 时 间 是 否 相 匹配 。 当 N 扩大 一 售 
时 ,， 则 线性 程序 的 运行 时 间 乘 以 因 于 2, 一 次 程序 的 运行 时 间 乘 以 因子 4， 而 三 次 程序 则 素 因 
子 8。 以 对 数 时 间 运 行 的 程序 当 N 增加 一 倍 时 其 运行 时 间 只 是 多 加 一 个 常数 ， 击 以 
O(N log N) 运 行 的 程序 则 花费 比 在 相同 环境 下 运行 时 间 的 两 倍 稍 多 一 些 的 时 间 ， 如 果 低 阶 
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项 的 系数 相对 地 大 ,并 且 N 又 不 是 足够 地 大， Bae TETUR dE RE RE. 例如 ， 
对 于 最 大 了 序列 和 问题 , UM N =10 增 到 N= 100 时 ,运行 时 问 的 变化 就 是 一 个 例子 . 单纯 
f SERE PERM RT FAK AS OCN log N 程序 是 非常 困难 的 。 

验证 一 个 程序 是 否 是 口 (FUND)) 的 另 -- 个 常用 的 技巧 是 对 N 的 甘 个 范围 (通常 用 2 的 倍 
数 障 开 }) 计 算 比 值 TON) FOND. 其 中 TIN 是 任 经 验 观 察 到 的 运行 时 间 - 如 条 FON) Rim 
行 时 间 的 理想 近似 , 那么 所 算出 的 值 收 僵 于 一 个 正常 数 。 如 果 f(N) 估 计 过 天 , 则 算出 的 值 
Wee O0. 如果 了 FCN) 合计 过 和 低 从 而 程序 不 是 OCFCN)) 的 , 那么 算出 的 值 发 散 。 

作为 一 个 例子 , 图 2- I2 中 的 程序 段 计算 两 个 随机 选取 出 并 小 于 或 等 于 N RESER 
互 素 的 概率 。( 当 N 增 太 时 , 结果 将 趋同 于 6 7 m7.) 









| Rel = 6; Tot = 0; 
for( 1 = 1; 1 <= Ni i++ 2 
for( j 2-3 + 1; j <=] N; je 2 
i 
Tote: 
if€ Gecdi i, 3 } == 13 
Rel++; 


| printf( "Percentage of relatively prime pairs is #Pf\n", 
( double ) Rel / Tot 3; 
图 2-12 fa PPTL Ee AE 
污 者 应 该 能 够 立即 对 这 个 程序 做 出 分 析 . 图 2- 13 显示 实际 观察 公 的 该 例 程 在 一 台 具 体 
的 计算 机 上 上 的 运行 时 间 . 该 图 表 指 出 , 表 中 的 万 后 一 列 是 最 有 可 能 的 , 因此 所 得 出 的 这 个 分 
析 很 可 能 正确 . 注意 , 在 ONDA O(NalogN) 之 间 没 有 多 大 差别 .因为 对 数 增长 得 很 慢 。 
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图 2-13 对 上 述 例 程 的 经 验 运 行 时 间 


2.4.6 ”分析 结果 的 准确 性 

经 验 指出 ， 有 时 分 析 会 估计 过 大 如 果 这 种 情况 发 生 , Abe 或 者 需要 分 析 得 更 细 ( 一 般 通过 
机 敏 的 观察 ), 或 者 可 能 是 平均 运行 时 间 显 著 小 于 最 坏 情 形 的 运行 时 间 而 又 不 可 能 对 及 得 的 完 
再 加 以 改进 。 对 于 许多 复杂 的 算法 , 最 坏 的 界 通过 未 个 不 良 输入 是 可 以 达到 的 , 但 在 实践 中 它 
通常 是 估计 过 大 的 , 站 憾 的 是 ,对 于 大 多 数 这 种 问题 ， 平均 情形 的 分 析 是 极其 复杂 的 (在 许多 情 
形 下 还 是 未 解决 的 }, THR RIS EA E 分 悲观 但 却 是 最 好 的 已 知 解析 结 采 。 
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总 结 


I^ =L 


KA eT pA RY B ZPO GRU, 它 并 不 是 完善 的 分 析 指 南 。 简 
单 的 程序 通常 给 出 简单 的 分 析 , 但 是 情况 也 并 不 总 是 如 此 。 作 为 一 个 例子 , 在 本 书 稍 后 我 们 
将 看 到 一 个 排序 算法 ( 希 尔 排序 , 第 7 章 ) 和 一 个 保持 不 相交 集 的 算法 (第 8 章 ), 它们 大 约 部 
需要 20 行程 序 代码 。 和 着 尔 排序 (Shelisort) 的 分 析 仍 然 不 完善 ,而 不 相交 集 算 法 分 析 非 常 困 
难 , 需要 许多 页 错综复杂 的 计算 。 不过, 我 们 在 这 里 遂 到 的 大 部 分 的 分 析 才 是 简 单 的 ,它们 
涉及 到 对 循环 的 计数 。 

- .类 有 趣 的 分 析 是 下 看 分 析 , 我 们 尚 术 接触 到 。 在 第 7 章 我 们 将 看 到 这 方面 的 一 个 例子 : 
证 明 尾 何 仅 通过 使 用 比较 来 进行 排序 的 算法 在 最 坏 的 情形 下 只 需要 OON log N) 次 比较 。 下 
界 的 证 明 一 般 是 最 困难 的 ,因为 它们 不 只 适用 求解 其 个 问题 的 一 个 算法 而 是 返 用 求解 该 问题 
的 一 类 算法 。 

在 本 章 结束 前 ,我们 指出 此 处 措 述 的 某 些 算法 在 实际 生活 中 的 应 用 。Gea SOLAR RESI 
法 应 用 在 密码 学 中 。 特 别 地 ,200 (HORS RET AMER GA AP 200 位 的 数 ) 
而 在 每 乘 一 次 后 只 有 低 200 位 左右 的 数字 保留 下 来 。 由 于 这 种 计算 需要 处 理 200 位 的 数字 ， 
因此 效率 显然 是 非常 重要 的 。 求 因 运算 的 直接 相 琵 会 需要 大 约 10 吕 次 乘法 ,而 上 面 描 述 的 算 
法 只 需要 大 约 1 200 次 乘法 。 


练习 


2.1 REKREITA: N, VN, NES, N?, N log N, N log log N, N log N， 
N log(N2), 2/N, 2%, 2%”, 37, N'logN, N*, 指出 哪些 函数 以 相同 的 增长 率 增 长 。 
2.2 E TION) E OCFCND f TAN = OCFCND), FIFAMA? 
a. T,(N) + TA N}= OCFCN)) 
b. T((N) - T2€N) - aC fCN)) 





^ TON) ~ 
d. TI(N)= OCT5(ND)) 
2.3. BRA BECHER LN. log N, 还 是 NT* IN (Ce 0)? 
2.4 ERAXMER HR k, log‘N=o0(N). 
2.5 求 两 个 函数 FON) A gON), 使 得 FUNDA OC KON) R gUNDsE OCF(N)). 
2.6 ”对 于 下 列 六 个 程序 片段 中 的 每 一 个 ; 
a. 给 出 运行 时 间 分 析 ( 使 用 大 OD)» 
bp. 用 你 选择 的 程序 语言 编程 ,并 对 N 的 若 于 具体 值 给 出 运行 时 间 。 
c. 用 实际 的 运行 时 间 与 你 所 做 的 分 析 进 行 比较 。 


It Sum = Q; 
forci = 0; 3 « N; dier 2 
SUM++ 5 


(2) Sum = Ü; 
fort 3 = 0; 1 < N; Ite) 
for( j = 0; j < Ni 1€ 3 
ume ; 


i31 Sum z 0; 
forf 120; 7 < N; de 3 
ford j= 0; je N~“ N; jee ld 
SUM ++ ; 


i31 Sum = 05; 
for( i = 0: 3 « N; i++] 
for( j 20; jx i; j++ 2 
RUME + ; 
[3t Sum = O; 
for( i= D; i < Ni ie ) 
fort y= 0: dj <i * i$; je] 
fort k= 0; k « J: k++ 3 
hum, 


lf! Sum = d; 
fort 1 = 1; i < N; d 3 
fort j= 1; J « 1 * di Ite) 
ife 3 € i 2-0) 
fort k - 0; k < j; k-+ } 
Sume+: 


2.7 EREE- BEN N A ARRA — A RELE tA, TIS. 14, 3, 1, 5, 2; H3. 1, 4, 2, 


SUE AR, IS, 4, 1, 2. ADE, 因为 数 1 出 现 两 次 而 数 3 ANP. 这 个 


程序 常常 用 于 模拟 - 些 算法 。 我 们 假设 存在 -- 个 随机 数 生成 事 RaudiInt or. j), EV 

相同 的 概率 生成 y 和 7 之 问 的 一 个 整数 . Pme TH: 

b. 如 下 填 人 从 AOIRA ALN -1 的 数组 A ; W TIRA Ali], ERP RAEI Ae 

ru EE ATO], AL, ， , AL ET LUN, BPÉERIRALAT G1. 

2. IEEE, 但 是 些 保 存 一 个 附 串 的 数组 ,， 称 之 为 Used GAT SB. “STL 
数 Ron 最 初 被 放 人 数组 上 的 时 候 , E Used! Ran = 1. 这 就 起 说 ， 当 用 一 个 随机 
PUAA A[ 门 时 ,可 以 用 一 步 米 测试 是 否 该 随机 数 已 经 被 使 用 ,说 个 是 像 第 -个 算 
法 那样 (可 能 ) 进 行 i 步 测试 。 

3. 填写 该 数组 使 得 Ali]=i+5- 然后 : 

forti=1: i N; it 
Swap RA" 1 ], SA. RandInt( 0, i ), ti 


a. 证 明 这 三 个 算法 都 生成 合法 的 置换 ,并 且 所 有 的 置换 者 在 等 可 能 的 ， 
b. 对 每 一 个 算法 给 出 你 能 够 得 到 的 尽 可 能 准确 的 期 望 的 运行 时 间 分 析 ( 几 大 OD. 
c. 分 别 写 出 程序 来 执行 每 个 算法 10 次 , 得 出 一 个 好 的 平均 但 , 对 N = 250. 500, 
1000, 2000 运行 程序 1; 对 N=2500, 5000, 10000. 20000, 40000, 80000 运行 
程序 2; XbN-10000, 20000, 40000, 80000, 160000, 320000. 640000 运行 程序 3， 
d. 将 实际 的 运行 时 间 与 你 的 分 析 进 行 比较 。 
e. 每 个 算法 的 最 坏 情 形 的 运行 时 间 居 什么 ? 
2.8 用 运行 时 间 的 估计 值 完成 图 2-2 中 的 表 ， 当 叶 这 些 估 计 值 太 长 无 法 模拟 。 插入 这 些 算 
法 的 运行 时 间 并 估计 计算 “上 特 万 个 数 的 最 大 子 序 列 和 所 需 此 的 时 间 . aR AT BE E 
Ww? 
2.9 计算 P(X) = DIL AX 需要 多 少时 间 ? 
a. 用 简单 的 程序 执行 取 拓 运算 E 
b. EH 2.4.4 PR ABETSE. 
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考虑 下 述 算法 ( 称 为 Horner 法 则 ), 计算 FCX) = DD, AX! 的 值 ; 


Poly = 0; 
for( 1 = N; 1 >s Qi 1-- D 
Poly = X * Poly + ALi]; 


a. XF X=3, F(X) 24X* - 82 er X42 指出 该 算法 的 各 步 是 如 何 进 行 的 。 

b. 解释 该 算法 为 什么 能 够 解决 这 个 问题 。 

c. 该 算法 的 运行 时 间 是 多 少 ? 

给 出 一 个 有 效 的 算法 来 确定 在 整数 AX AX AGS ww. < Ay 的 数组 中 起 天 存在 

整数 ; 使 得 A;= is 你 的 算法 的 运行 时 间 是 多 少 ? 

给 出 有 效 的 算法 (及 其 运行 时 间 分 析 ): 

. 求 最 小 子 序 列 和 ， 

b. 求 最 小 的 正 子 序 列 和 。 

c. 求 最 大 子 序列 乘积 。 

a. 编写 一 个 程序 来 确定 正 整数 N 是 否 是 素数 。 

b. 你 的 程序 在 最 坏 情形 下 的 运行 时 间 是 多 少 ( 用 N 表示 )? (你 应 该 能 够 写 出 O 
G/ N 1) 的 算法 程序 。) 

c. 4 B 等 于 N 的 二 进 制 表示 法 中 的 位 数 。B 的 值 是 多 少 ? 

d. 你 的 程序 在 最 坏 情形 下 的 运行 时 间 是 什么 (用 B 表示 )? 

e. 比较 确定 一 个 20( 二 进 制 ) 位 的 数 是 否 是 素数 和 确定 一 个 40{ 二 进 制 ) 位 的 数 是 否 
是 素数 的 运行 时 间 。 

f. 用 w EX B 给 出 运行 时 间 更 合理 吗 ? 为 什么 ? 

Erastothenes 得 是 一 种 用 于 计算 小 于 N 的 所 有 素数 的 方法 。 我 们 从 制作 整数 2 到 N 

HEFG, 我 们 找 出 最 小 的 未 被 删除 的 整数 i, 打印 i, 然后 删除 i, 2i, 3i，...。 当 

i >wN it, 算法 终止 . 该 算法 的 运行 时 间 是 包 少 ? 

证 明 X8 可 以 只 用 8 次 乘法 算出 。 

不 用 递归 , 写 出 快速 求 押 的 程序 。 

给 出 用 于 快速 取 寡 运算 中 的 乘法 次 数 的 精确 计数 。( 提 示 : 考 虑 N 的 二 进 制 表 不 ) 

程序 A 和 BB 经 分 析 发 现 其 最 坏 情形 运行 时 间 分 别 不 大 于 50N log; iN AUN? QR AT 

BE. 请 回答 下 列 问题 

a. N 值 很 大 时 (CN > 10000), 哪 一 个 程序 的 运行 时 间 有 更 好 的 保障 ? 

b. N 值 很 小 时 (CN < 100), 哪 一 个 程序 的 运行 时 间 更 少 ? 

c. 对 于 N=1000, 哪 一 个 程序 平均 运行 得 更 快 ? 

d. 对 于 所 有 可 能 的 输入 , 程序 B 是 否 总 能 够 比 程序 4 运行 得 更 快 ? 

天 小 为 N 的 数组 A， 其 主要 元 素 是 ~- 个 出 现 次 数 超过 N 72 的 元 素 ( 从 而 这 样 的 元 素 

最 多 有 一 个 )。 例 如, 数组 

3, 3, 4, 2 , 4, 4, 2, 4,4 

有 一 个 主要 元 素 4, 而 数组 

3, 3, 4, 2, 4, 4.2, 4 

没有 主要 元 素 , 如 果 没 有 主要 元 素 , 那么 你 的 程序 应 该 指出 来 。 下 面 是 求解 该 问题 的 
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- -个 算法 的 慨 要 ; 

首先 ， 找 出 主要 元 康 的 一 个 怪 选 元 (这 是 难点 ), 这 个 收入 元 是 惟一 有 可 能 证 主 波 元 
FOLE. 第 二 步 确 定 是 否 该 候选 元 实际 上 就 是 主要 元 素 , 这 正好 是 对 数组 的 顺序 
搜索 。 为 找 出 数组 A 的 一 个 辟 选 元 ,构造 第 二 个 数组 D. 比较 A, 和 AY; ege) 
We, WR Pes wR P; SMA Re, Ree A, AQ, 同样 地 ， 
如 果 它 们 相等 ， 则 取 其 中 之 一 加 到 BP; 否则 什么 也 不 繁 。 以 该 方式 继续 下 去 站 到 
读 完 这 个 的 数组 。 然后, ha PR BP aA, Eee A RI. CA 
+47) 

a. 35 0H Gay x ib? 

b. 34 N 是 奇数 时 ,如 何 处 理 ? 


* c. 该 算法 的 运行 时 间 是 多 少 ? 


d. 我 们 如 何如 人 狗 使 用 附加 数组 B7 


~ a. 编写 一 个 程序 求解 主要 儿 骑 . 


为 什么 在 我 们 的 计算 机 模型 由 假设 整数 具有 岗 定 长 度 是 重要 有 的， 

考虑 第 1 章 中 描述 的 字迹 游戏 问题 , 很 设 我 们 网 定 最 民 单 误 的 大 小 为 10 0E SE. 

a VER, CRW ^r ER E ui PR. RABI TR, 那么 在 第 1 SEDES 
述 的 算法 用 R, CAW 表示 的 运行 时 间 吓 多 少 

设 单词 表 是 预先 排序 过 的 : 指出 如 何 使 用 对 分 查找 得 到 : … 个 这 行 时 间 少 得 多 的 
算法 。 

没 在 对 分 查找 程序 的 第 5 行 的 语句 是 Low = Mid 而 不 是 Low = Mid + 1, iX T fe Hr A fie 
正 情 运行 时 ? 

实现 对 分 查找 使 得 在 每 次 选 代 中 只 有 一 个 一 路 比较 : 

设 算法 3{ 图 2-7) 的 第 6 行 和 第 7 人行 和 


/* 6*/  MaxLeftSum = MaxSubSum( A, Left, Center - 1 ); 
/* 7*/  MaxRightSum = MaxSubSum( A, Center, Right 3 


RE, xx THER IE RE LE et? 

立方 最 大 子 序列 和 算法 的 内 循环 执行 NON 41 DON €2)/6 PORA E IRIS EE INS TH 
应 的 二 次 算法 执行 NON + 1}/2 GER. 而 线性 算法 执行 N WER: ERG ie 
然 的 ? 你 能 给 出 这 种 现象 的 组 合 学 解释 吧 ? 
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BI 表 、 枝 和 队列 


本 下 讨论 最 简单 和 最 基本 的 一 种 数据 顷 构 “实际 上 , 每 -… 个 有 意义 的 程序 部 将 明晰 地 至 
Lefer REZA H. RUT PR ae PR Se HB 不管 你 在 程序 中 是 而 做 本 
WA f arb, 我 们 将 重点 

© 介绍 抽象 数据 类 型 (ADT) 的 概念 

© 阐述 如 何 对 去 进行 有 效 的 操作 . 

© 介绍 栈 ADT ME ASE ABU y ET] 

© 介绍 队列 ADT ER FCTETRTE Re Hit iy H 

A Ar xc dez Pp. EDDA AE AA RE BSL. PR 
"afe. X BE AY PRE ee ESI EB DN X43 di EEBU- RE LITARA A RE 


3.1 抽象 数据 类 型 


ELPA REAR WS -是 例 程 不 点 超过 一 页 .这 订 以 通过 把 程 丰 分 制 为 : 些 模块 
(nodul 来 实现 ART LUE — TE 8 Rr HU PEE Ee aT A] TA ry 
POS ERHEBEN ERIALA. noc. Wep IERRA PIT A E 95. 
£T AED - SER RR ROA. ETHER CTE E IESUS mx 
ROAR AE AAF., ixMREBHEPDEX A UE, Te BR tS eT 
双重 要 的 当然 是 让 个 例 程 去 实现 它 ” 如 果 打 型 语 急 分 散在 程 友 各 处 . Bb Ze BR ATU 
Zs AA HES. AERAR EREA $8 89 AL ta RB EDUC A UI 2 

Ab 8 34S EE (abstract data wpe. ADT) AE - 些 操 作 的 集合 - i e ce RA Bee TI Bn 
$i 在 ADT RE CUPRA A an fap sc He ng fed. GA Te ERURTEUHTRUAT $e 

Mi, 集合、 AE MAE a pos fen A THE. RR. KAA fi 
MERMA ES HOR SUR A RE A EP BORAT. TI A arc 
们 自己 相关 的 操作 .对 于 集合 ADT, RITA LAARA union), £ intersection). M EKn 
(ize) DA de (complernent} VERE , 或者. 我 们 也 可 以 只 要 两 种 操作 : 并 和 查找 (iind}， 这 
黄种 操作 尺 在 该 华 合 圭 定义 了 一 种 不 同 的 ADT 

我 们 的 基本 的 想法 是 ,这些 操作 的 实现 只 在 程序 中 编写 一 次 、 而 程序 中 任何 其 他 党 分 而 
BTR ADT 上 运行 其 中 的 -种 操作 时 可 以 通过 调用 适当 的 溺 数 来 进行 ”如 由 由 十 条 种 原 国 
ASEVUBNMHENYB f. 那么 通过 只 修改 运行 这 些 ADT 操作 的 例 程 应 该 容 奶 实现 ”在 理想 的 
情 疯 下 这 种 长 蛮 对 于 程序 的 其 余部 分 通 汕 是 元 全 选 闭 的 : 

对 十 每 种 ADT 并 不 存在 什么 法 则 来 告诉 我 们 必须 要 有 哪些 操作 ; 这 是 一 个 设计 关 采 
HGPA IE ALLEE ER Cos B 77) A RUE ES RRA A POETS 
这 dE ADT 的 最 基本 的 例子 . 我 们 将 会 看 到 它们 中 的 每 一 种 是 如 何以 多 种 方法 
Ar HAS. dud. 合用 它们 的 程序 却 没有 必要 知道 它们 是 如 何 正 确实 现 胸 


3.2 X ADT 
我 们 将 处 理 -- 般 的 形 如 AS. Ao. Aas ss ABB XE 我 们 说 , 这 个 点 的 大 小 是 N\， 我 
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3 条 3 六 
们 称 大 小 为 0 的 表 为 室 表 (empty list). 

对 于 除 空 表 外 的 任何 表 , 我 们 说 4 EHE A, CHE A, SAAR A, (Ci < NDBUSR A, 
G > 1)。 表 中 的 第 -个 元 素 是 A, 而 最 后 一 个 元 素 是 4v、 我 们 将 不 定义 A. 的 前 驱 元 , 也 
不 定义 Ay 的 后 继 元 。 ICH A, 在 表 中 的 位 置 为 i。 为 了 简单 起 见 , 我 们 在 讨论 中 将 假设 表 中 
的 元 素 是 整数 , 但 一 般 说 来 任意 的 复元 素 也 是 允许 的 。 

与 这 些 “ 定 义 " 相 关 的 是 我 们 要 在 表 ADT 上 进行 的 操作 的 集合 。PrinzList Hl MakeEmpty 
是 常用 的 操作 ,其 功能 显而易见 ; Find 返回 关键 字 首 次 出 现 的 位 置 Insert 和 Delete 一 般 是 
从 表 的 革 个 位 置 插 人 和 删除 某 个 关键 字 ; 而 Find Kth 则 返回 某 个 位 置 上 (作为 套数 而 被 指定 ) 
的 元 素 。 如 果 34, 12, 52, 16, 12 Jé— 1 4. 则 Find (52) 会 返回 3; Insert CX, 3) 可 能 拒 表 
"E34, 12, 52, X, 16, 12( 如 果 我 们 在 给 定位 置 的 后 面 播 人 的 话 ); 而 Delete (52) 则 将 该 到 
ty 34. 12, X. 16，12。 

当然 ,一 个 函数 的 功能 怎样 才 算 怡 妆 , 完全 要 由 程序 设计 员 来 确定 ， 就 像 对 特殊 情 次 的 
处 理 那 样 (例如 ,上 上述 Find (1) 返 回 人 村 么 ?)。 我 们 还 可 以 添加 一 些 运算 ,比如 Nert 和 Previ- 
ous ,它们 会 到 一 个 位 置 作为 参数 并 分 别 返 回 其 后 继 元 和 前 豫 元 的 位 置 。 
3.2.1 胡 的 简单 数组 实现 

对 表 的 所 有 操作 都 可 以 通过 使 用 数组 来 实现 。 虽 然 数组 是 动态 指定 的 , 但 是 还 是 需要 对 
表 的 大 小 的 最 大 值 进 行 佑 计 。 通 常 需要 估计 得 大 一 些 , 从 而 会 浪费 大 量 的 空间 。 这 是 产 重 的 
局 限 , 特别 是 在 存在 许多 未 知 大 小 的 表 的 情 次 下 。 

数组 实现 使 得 PrintList 和 Find 正如 所 预期 的 那样 以 线性 时 间 执 行 ,而 FindKeh 则 花 费 常 
数 时 间 。 然 而 , 插 人 和 删除 的 花费 是 昂贵 的 ， 例 如 ,在 位 置 0 的 插入 (这 实际 上 是 做 一 个 新 的 第 
元素) 首先 需要 将 整个 数组 后 移 一 个 位 置 以 空 出 空间 来 ， 而 删除 第 一 个 元 素 则 需要 将 表 中 的 所 有 
元 素 前 移 一 个 位 置 , 因此 这 两 种 操作 的 最 环 情况 为 ON) 平均 来 看 ， 这 虎 种 运算 都 需要 移动 表 
的 - 半 的 元 素 , 因此 仍然 需要 线性 时 间 。 只 通过 N 次 相继 插 人 来 建立 一 个 表 将 需要 二 次 时 间 。 

因为 插 人 和 删除 的 运行 时 间 是 如 此 的 慢 以 及 表 的 大 小 还 必须 事先 已 知 ， 所 以 简单 数组 一 
艇 不 用 来 实现 表 这 种 结构 。 
3.2.2 链表 

为 了 避免 插 人 和 期 除 的 线性 开销 , 我们 需要 允许 表 可 URE, BURRS 
部 需要 整体 移动 。 图 3-1 表达 了 链表 {linked list) 的 一 般 想法 。 

链表 由 一 系列 不 必 在 内 存 中 相连 的 结构 组 成 。 每 一 个 结构 均 含 有 表 元 素 和 指向 包含 该 元 
素 后 继 元 的 结构 的 指针 。 我 们 称 之 为 Next 指针 。 最 后 一 个 单元 的 Next 指针 指向 NULL; 该 
值 由 C 定义 并 且 不 能 与 其 他 指针 泥 清 。ANSI CC 规定 NULL A. 

我 们 回忆 一 下 ， 指针 变量 就 是 包含 存储 另外 某 个 数据 的 地 址 的 变量 。 因 此 ， mee P Bos 
明 为 指向 一 个 结构 的 指针 , 那么 存储 在 P 中 的 倩 就 被 解释 为 主 存 中 的 一 个 位 置 ， 在 该 位 置 能 
够 找到 一 个 结构 。 该 结构 的 一 个 域 可 以 通过 PF -> FieldName 访问 ， 其 中 FieldName BRAN 
想 要 考察 的 域 的 名 字 。 图 3-2 指出 图 3-1 中 表 的 具体 表示 。 这 个 表 含 有 五 个 结构 , 恰好 在 内 
存 中 分 配给 它们 的 位 置 分 别 是 1000, 800, 712, 992 和 692。 第 一 个 结构 的 指针 含有 值 800, € 
提供 了 第 二 个 结构 所 在 的 位 置 。 其 余 每 个 结构 也 都 有 一 个 指针 用 于 类 似 的 目的 。 当 然 , 为 了 访 
问 该 老 ,我 们 需要 知道 在 哪里 能 够 找到 第 一 个 单元 。 指针 变量 就 能 够 用 于 这 个 目的 。 ERE 
Sid, 一 个 指针 就 是 一 个 数 。 本 章 此 余部 分 我 们 将 用 箭头 画 出 指针 ， 因为 这 样 更 直观 。 
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Teo 800 712 992 692 
[H32 带 有 指针 县 体 值 的 链 去 


为 了 执行 PrntList(L)EE Find L, Key), RREH- :个 指针 和 传递 到 该 表 的 第 一 个 元 
Z. SRRIHI— EE Next 指针 穿越 该 表 即 可 .这 种 操作 显然 是 线性 时 间 , A Pe eR 
比 用 数组 实现 时 要 大。FindKith 操 基 不 如 数组 实现 的 效率 高 ; FindKt L, HER OC TTA 
VASE EE rS SPREE A SE 在 实践 中 这 个 界 是 保守 的 , 因为 调用 FindKih ff WEE FE D 
掉 序 的 方式 进行 。 和 例如. FindKth( 上 ,2), FindKih(C L. 3). Find&ith( L, 4) 004 Findkth(L. 6) 4) 
通过 对 表 的 一 次 扫 揪 同时 实现 . 

删除 命令 可 以 通过 收 改 一 个 指针 来 实现 。 图 3-3 给 出 在 原 表 中 删除 第 一 个 元 素 的 缚 玉 ， 





Bel 3-3 从 链表 中 删除 


插入 命令 需要 使 用 一 次 malloc 调用 从 系统 得 到 一 个 新 单元 (后 而 将 详细 沦 述 ) 并 在 此 所 

执行 两 深 指针 调整 。 其 --- 般 想法 在 图 3-4 中 给 出 ,其 中 的 虚线 表 水 原来 的 指针 。 
| M AS deg Ld a LL l4 
To eA ET 
\ 一 j 
L- ~i , 
. 图 3-4 [5 ET e ELA. 

3.2.3 程序 设计 细 书 

上 面 的 措 述 实际 上 是 以 使 得 - -部 分 都 能 正常 工作 , 但 还 是 有 几 椒 地方 可 能 会 出 问题 。 痛 
此， 并 不 存在 从 所 给 定义 出 发 在 表 的 前 面 插 入 元 素 的 真正 显 性 的 方法 。 第 二 ， 从 表 的 前 面 实 
行 删 除 是 - -个 特殊 情况 , SACE T RIE: 编程 中 的 蚊 忽 将 会 造成 表 的 天 失 。 第 一 
个 问题 涉及 一 般 的 删除 。 昌 然 上 述 指 针 的 移动 很 简单 ， 但 是 删除 算 靶 要 求 我 们 记 作 被 删除 元 
XC IET UC e 

事实 上 , BOAR 个 简单 的 变化 就 能 够 解决 所 有 这 三 个 问题 ， 我 们 将 留 出 一 个 标志 结 点 ， 有 时 
(RRS AA (header) 8 9E 25 (dummy node) 这 是 通常 的 一 种 习惯 , 在 后 面 将 会 多 次 看 到 它 。 我 
(Jane, SAH Ob. 图 3 5 表示 一 个 带 有 表 头 的 链表 ， EERE A, Ar. --., As: 

ES eA READER) - 些 问题 ,我 们 需要 编写 例 程 FindPrevious , 它 将 返回 我 们 要 删除 的 
表 雹 的 前 驱 元 的 位 置 。 如 果 我 们 使 用 表 头 ， 那么 当 我 们 删除 表 的 第 -- 个 元 素 时 ，FindPrevious 
Xi A HUGE E 头 结 点 的 使 用 多 少 是 有 些 争 议 的 。- - 些 人 认为 ， 添加 假想 的 单元 只 是 为 了 
避免 特殊 情形 ,这样 的 理由 不 够 充足 ; 他们 把 头 铺 点 的 使 用 看 成 与 老式 的 随意 删改 没有 多 大 区 
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header} 1 Ay | i- ; 
L 


图 3-5 其 有 表 头 的 链表 


BY. 不 过 即使 这 样 , 我 们 还 是 在 这 时 使 用 它 , 这 完全 内 为 它 司 我 们 能 够 表达 基本 的 指 竺 操作 用 
区 不 致使 特殊 情形 的 代码 含混 不 清 。 除 此 之 外 , 要 不 要 使 用 表 头 则 龙 属 于 个 人 兴趣 的 问题 。 

作为 例子 ,我 们 将 把 这 些 表 ADT 的 半数 的 例 程 编写 出 来 。 Boo. AR 3-6 中 给 出 我 们 需 
要 的 声明 - PARC MAE, 作为 类 型 的 List( 表 ) 和 Position( 和 位 置 ) 以 及 函数 的 原型 都 刚 在 且 
WEJ h 头 文件 中 。 具 体 的 Node tk S ERME .c XH F. 





| “ifndef iist H 


struct Mode; 


typedef struct Mode *PtrToNode; 
typedef PtrfoNode List, 
typedef PtrToNoade Position; 


List MakeEmpty( List L ); 

int IsEmpty( List L ); 

int IsLast( Position P, List L 3: 

Position Find( ElementType X, List L 5; 

void Delere( Elementtype X, List L 3; 

Position FindPre&vious( ElementType X, List L }; 
void Insert( ElementType X, List L, Position P ); 
void DeleteListt List L 3; 

Position Header( List L 3; 

Position First¢ List L }; 

Position Advance( Position P 3; 

ElementType Retrieve(C Position P }; 


*endi f /* List H */ 


/* Place in the implementation file */ 
struct Node 
i 

ElementType Element; 

Position Next; 


[ 





图 3-6 链表 的 类 型 声明 


我 们 将 编写 的 第 一 个 函数 是 测试 空 表 的 。 当 我 们 编写 涉及 指针 的 任意 数据 结构 的 代码 
时 ,最 好 总 是 要 先 画 出 一 张 图 来 。 图 3-7 就 表示 一 个 空 表 ; 按照 这 个 图 , 很 容易 写 出 图 3-8 中 
FAR XC. 

KP EER 3-9 PEA, 它 测试 当前 的 元 素 是 可 是 表 的 最 后 一 个 元 素 , 假设 这 个 元 
素 是 存在 的 。 

我 们 要 写 的 下 一 个 例 程 是 Find. Find 在 图 3-10 FRH, Tik E 某 个 元 素 在 岩 中 的 位 
mo odis AG Ge e EE HER, 即 如 果 与 (and) 运 算 的 前 半 aden 
部 分 为 假 , 那么 结果 就 自动 为 假 , 而 后 半 部 分 则 不 再 执行 。 E 

有 此 编程 人 员 发 现 递归 地 编写 Find MARMARA, AME 
因为 这 样 可 能 以 免 侈 长 的 终止 条 件 。 后 面 将 看 到 , 这 是 一 个 非常 业 
gne, 我们 要 不 惜 一 切 代价 避免 它 ， 图 3- RANER 
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/* Return true if L is empty ^/ 
int 

FsEmptyr List | ) 

[ 


| | 
| i 
| | 
| 


return c- >Next == NULL: 


Hl 3.8. MRA- “ee dE RITE 


| . - ， , 
' jf* Return true if P is the last position in list L */ 
| f* Paramater | is unused in this implementation “y 


int 
' TsLast{ Position P, List L 3 


| d 
| 1 





return PeoNext == NULL | 


Lo — 





L- n LLL o 
图 3.9 ji i da Cr PE ET ERRER 
m (1 
/* Return Position of X in L; NULL 1f not found */ | 
| ! 
| Position í 
Find( ElementType X, list |. } | 
| 
Positión P; 
fr ly P = L->Next: 
ft 5j whilet P !z NULL && P--Element !- X ] 
f* ay P = FK-»-Mext; 
| fe AEF return P: 


fA 3-10 Find Bg 


第 四 个 例 程 是 删除 表 L 中 的 某 个 元 素 X。 我 们 需要 决定 : 如 果 X MBL PIL KAER 
agen. 那么 我 们 微 什 么 ?我 们 的 例 程 将 删除 第 一 次 出 现 的 和 , 如果 X 不 在 表 中 我 们 就 什 
么 也 不 做 、 为 此 , 我 们 通过 调用 FindPrevious KRGE $i X 的 表 元 的 前 驱 元 P。 实 现 删 除 
GSES ES 3.11 Pet. FindPrevious [np FRE IF Find . TE 3-12 中 到 出 。 


/* Delete first occurrence of X from a list *"/ 
/" Assume use of a header node * 


val d 
Delete( ElementType X, List Lì 


P = FindPrevious( X, L }; 


{fC !Islast( P, L 2 } /* Assumption of header use */ 

{ /* X is found; delete it */ 
TmpCel] - P->Next; 
P-»Next = Tmpcell-sNext; /* Bypass deleted cell “/ 


| | 
' Position P, TmpCell; | 
free( TmpCell 2; 


aar BERR AR AH AS 


EN I 


m 
地 






/* If X is not found, then Next field of returned */ 
/* Position is NULL */ 
/* Assumes a header */ 









Position 
FindPrevious( Elementiype X, List t ) 
i 


Position P; 







P æL; 
A 2*/ while( P-»Next l= NULL && P--Next-»Element != X ) 
/* d" P = P-sNext: 


£" 4*/ return P; 


E] 3.12 FindPrevious——— JJ 5j Delete 一 起 使 用 的 Find A 


我 们 要 写 的 最 后 一 个 例 程 是 插入 例 程 。 将 要 插入 的 元 素 与 表 工 和 位 置 了 一 起 传人 。 这 
个 Insert 例 程 将 一 个 元 素 播 人 到 由 下 所 指示 的 位 置 之 后 。 我 们 这 个 决定 有 随意 性 , CERA 
插入 操作 如 何 实现 并 没有 完全 确定 的 规则 。 很 有 可 能 将 新 元 素 插 入 到 位 置 PA EME P 
处 当时 的 元 素 的 前 面 ), 但 是 这 么 做 则 需要 知道 位 置 P 前 面 的 元 素 。 它 可 以 通过 岗 用 Find- 
Previous 而 得 到 。 因 此 重要 的 是 要 说 明 你 要 干什么 。 3-13 完成 这 些 任务 。 


/* Insert (after legal position P) */ 
/* Header implementation assumed */ 
/* Parameter L is unused in this implementation */ 


void 
Insert( ElementType X, List L, Position P ) 


Position TmpCell; 


TmpCell = malloc sizeof( struct Node ) ); 
ift TmpCell == NULL 2 
Fatal!Error( “Out of space!!!" J; 


TmpCell-»Element = X; 
TmpCeli->Next = P--Next; 
P->Next = TmpCelt; 





图 3-13 SERA AE 


注意， 我们 已 经 把 表 工 传递 给 Insert 例 程 和 IsLast WH, 尽管 它 从 未 被 使 用 过 。 之 所 以 
这 么 做 , 是 因为 别 的 实现 方法 可 能 会 需要 这 些 信息 , 因此 , AMER L 有 可 能 使 得 使 用 
ADT 的 想法 失败 ,9 

Ek Find 和 FindPrewious BIER AGIT GE Delete , 它 调用 FindPrevious ) . 我 们 已 经 编码 
的 所 有 操作 均 需 O(1) 时 间 。 这 是 因为 在 所 有 的 情况 下 ， 不 管 表 有 多 大 都 只 执行 固定 数 日 的 
指令 。 对 于 例 程 Find 和 FindPrevious, 在 最 坏 的 情形 下 运行 时 间 是 ON), 因为 此 时 若 元 素 


林 找 到 或 位 于 表 的 末尾 出 可 能 遍历 整个 表 。 平 均 来 看 , 运行 时 间 是 ON), 因为 必须 平均 村 
HENE. 


O REARED, 不 过 有 些 编译 加 会 发 出 警告 。 
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TE Fg 3-6 中 列 出 的 其 他 例 程 相当 简单 。 我 们 也 可 以 编写 一 个 例 程 来 实现 Previous. BUS 
这 些 将 留 作 练习 : 
3.2.4 常 儿 的 铺 误 

和 过 到 的 错误 是 你 的 程序 因 来 自 系 统 的 琅 手 的 错误 信息 而 朋 深 ， 比如 ”memory access 
violation" EX "segmentation violation "这 种 信息 通常 意味 着 在 指针 变 基 包含 了 伪 地 所 。 一 个 通 党 
PU Re th EB, BD. 如果 图 3-14 中 的 第 Hue. 那么 了 就 是 未 定义 的 , 当然 
也 就 不 可 能 指向 内 仔 的 有 效 部 分 。 另 一 个 典型 的 错误 各 关 于 图 3-13 的 第 6 fr, WR PE 
NULL, 则 指向 是 尺 法 的 .这 个 函数 知道 卫 RAL NULL, 所 以 例 程 没有 问题 ， UA. 你 应 该 
仔细 考虑 . 伍 得 调用 Insert 的 例 程 能 保证 这 一 点 。 无 论 何 时 只 要 你 确定 一 个 指 回 , AL A 
必须 保证 该 指针 不 是 NULL。 有 些 避 编译 器 隐 式 好 为 你 做 这 种 检查 , 不 过 这 并 不 十 忆 标准 的 
一 部 分 。 当 你 将 -个 程序 从 一 个 编译 器 移 至 另 一 个 编译 器 下 时 , a RB ADE FA HIEMS 
行 .这 就 是 这 种 错误 常见 的 原因 之 一 。 








~ — 
| /* Incorrect Deletelist algorithm */ 
void 
| DeleteList{ List L 2 
{ 
| Position P; 
| f* O9) P-21-sNext; /* Header assumed */ 
f™ Qe; L->Next = NULL; 
2 ft 3f while¢ P t= NULL ) 
f 
| f* Atf freet P 3; 
| /* bef P = P->Next; 


I 





图 3-14 删除 一 个 表 的 不 正确 的 方法 


第 二 种 错误 涉及 何 时 使 用 或 何 时 不 使 用 malloc 来 获取 一 个 新 的 单元 。 我 们 必须 记 住 , 声 
明 指向 一 个 结构 的 指针 并 不 创建 该 结构 ,而 只 是 给 出 足够 的 空间 容纳 结构 可 能 会 使 用 的 地 
hk d s RES E ice Ee RS GR FB malloc HE Rt. malloc (HowManyBytes) 5f 
Up Au EE Up et — PRIA. AB, 如 果 你 想 使 用 一 个 指 
针 袜 械 沿 着 一 个 表 行 进 , 那 就 没有 必要 创建 新 的 结构 ; 此 时 不 宜 使 用 malloc 命令 TEH ZN] 
缩 泽 器 天 要 一 个 类 型 转换 (type cas BERRE PLAIT CERET malloc 的 其 他 形 
aC. 如 calloc。 这 两 个 例 程 郁 要 求 包含 stdlib.h X xs 

Maas bes a RESIS , 你 可 以 用 free 命令 通知 系统 来 回收 它 。free( 卫 ) 的 结 宁 起: PE 
在 指向 的 地 址 没 变 , 但 在 该 地 址 处 的 数据 此 时 已 无 定义 了 。 

加 果 你 从 未 对 一 个 链表 进行 过 删除 操作 , BB AVAL] malloc 的 次 数 应 该 等 于 表 的 大小 , ES 
有 表 涉 则 再 加 1。 少 一 点 儿 你 就 不 可 能 得 到 一 个 正常 运行 的 程序 ; 多 一 点 儿 你 就 会 浪费 空间 
并 可 能 要 浪费 时 间 。 慢 尔 会 出现 当 你 的 程序 使 用 大 量 空间 时 ， 系统 可 能 不 能 满足 你 对 新 单元 
的 要 求 。 此 时 返回 的 是 NULL 指针 。 

在 链表 中 进行 -一 次 删除 之 后 , 再 将 该 单元 释放 通常 是 一 个 好 的 想法 ， 特别 是 当 存 在 许多 
的 搬 人 大利 出 除 换 杂 在 一 起 而 内 存 会 出 现 问题 的 时 低 。 对 于 要 被 放弃 的 单元 ,应该 需要 S Cd 
take. OUTROS ET LEAR, POR EERSTE 作为 一 个 例子 , 图 3-14 的 代 
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图 3-15 显示 了 删除 工作 的 正确 方法 。 处 理 闲 置 空间 的 工作 未 必 很 快 完成 , 因此 你 可 能 
要 检查 看 是 各 处 理 的 例 程 会 引起 性 能 下 降 ,， 如 果 是 则 要 考虑 周密 。 本 书 作 者 号 了 一 个 程序 
(WLR 23) ,通过 对 处 理 空间 (10 000 个 结 点 ) 的 周密 考虑, 该 程序 加 快 了 站 fH. 事实 上 , 单元 
以 相当 特殊 的 顺序 被 释放 ,这 显然 会 引起 另 -- 个 线性 程序 花费 O(N log N) 时 间 去 处 理 N 个 
单元 。 


/* Correct DeleteList algorithm */ 


void 
Deletelist( List L } 
{ 


Position P, Tmp; 


P = L->Next: /* Header assumed */ 
L-»Mext = HULL; 
while( P !z NULL } 
i 
Imp = P-»MNext; 
free( P 5; 
F = Tmp; 
} 
} 





图 3-15 删除 表 的 正确 方法 

最 后 提 一 个 警告 ;, malloc(sizeof(PtrToNode)) 是 合法 的 , 但 是 它 并 不 给 结构 体 分 配 足 名 
的 空间 。 它 只 给 指针 分 配 一 个 空间 。 
3.2.5 Mek 

有 时 候 以 倒序 扫描 链表 很 方便 。 标 准 实现 方法 此 时 无 能 为 力 , 然而 解决 方法 却 很 简单 - 
点 要 在 数据 结构 上 附加 一 个 域 , 使 它 包含 指向 前 一 -个 单元 的 指针 即 可 。 其 开销 是 一 个 附加 的 
链 ， 它 增加 了 空间 的 需求 ,网 时 也 使 得 插 人 和 删除 的 开销 增加 一 倍 , 因为 有 更 多 的 指针 需要 
定位 。 另 一 方面 , 它 简化 了 删除 操作 ,因为 你 不 再 被 迫使 用 一 个 指向 前 驱 元 的 指针 来 访问 - - 
个 关键 字 ; 这 个 信息 是 现成 的 。 图 3-16 表示 一 个 双 链 表 (doubly linked list)» 


RTH THe THETA 
图 3.16 一 个 双向 链表 


3.2.6 TRUER 

让 最 后 的 单元 反 过 来 直 撒 第 一 个 单元 是 一 种 流行 的 做 法 。 它 可 以 有 表 头 ， 也 可 以 没有 表 
HEGER, 则 最 后 的 单元 就 指向 它 )， 并 且 还 可 以 是 双向 链表 (第 一 个 单元 的 前 驱 元 指针 
指向 最 后 的 单元 )。 这 无 疑 会 影响 某 些 测试 ， 不 过 这 各 结构 在 某 些 应 用 程序 中 却 很 流行 。 疝 
3-17 显示 了 一 个 无 表 头 的 双 回 循环 链表 。 





图 3-17 一 个 双向 循环 链表 
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3.2.7 例子 

我 们 提供 三 个 使 用 链表 的 例子 。 第 例 是 表示 一 元 多 项 式 的 简单 方法 ,第 二 例 是 在 某 些 
特 吻 情况 下 以 线性 时 间 壕 行 排序 的 一 种 方法 。 最 后 ,我 们 介绍 个 复杂 的 例子 , 它 说 明了 链 
此 如 何 用 于 大 学 的 课程 注册 . 
多 项 式 ADT 

FEN Tur EA Fi Aokig X- REX: F- UL CRUS EA PORE dm m e SM. m FOX) 
2 NT AX AURA RD RAE, WARTU T (p Y coe n oce ORC ARI 
nae EENET, oR. E. (ROS Hf Be EI ORE bebt, TET TIVA fis HE E 
3-18 中 给 出 的 类 型 声明 。 这 时 , JEf Dt SE RR ERT. EASE ASA 
种 可 能 的 运算 ; 它们 在 图 3-19 到 图 3-21 b xh. ZEE Sait AS But pu], W 
厄 注 例 程 的 运行 时 间 与 两 个 输入 多 项 式 的 次 数 的 习 积 成 正比 ， 它 适合 太 部 分 项 部 有 约 向 沁 和 多 
Bk, Hany POX) — 10x + sxV— LH P(X) = 3X9 — 2X4 11X + 5, 那么 
运行 时 间 就 可 能 不 可 接受 了 。 可 以 看 出 ， 大 部 分 的 时 间 都 化 在 了 乘 以 0 和 单 步调 试 两 个 输入 
多 项 式 的 大 量 不 存在 的 部 分 上 上 。 这 备 起 我 们 不 愿 看 到 的 。 


m~~ 
typedef struct 
{ 
int CoeffArray[ MaxDegree + 1 ]; 
int HighPower: 
| * Polynomial; 


| 
L 
图 3.18 ZDA ADT AYSHE EROS ERR US 





















| void 

| ZeroPolynomial( Polynomial Poly ) 

i 

， int i; 

| for( i = 0; i <= MaxDegree; i++ ) 
Poly->CoeffArray{ i ] = à: 

| Poly->HighPower = 0; 

} 


Lo, 
图 3-19 将 多 项 式 初始 化 为 委 的 过 程 
yoid 


AddPolynomial( const Polynomal Polyl, 
const Polynomial Poly2, Polynomial PolySum ) 





| 


| 1 

| int i; 

| ZeroPolynomial( PolySum 3; 

| PolySum->HighPewer = Maxt Polyl-»HàghPower, 

| Poly2-»HighPower }; 

| for( 1 = PolySum->HighPower; 1 >= 0; i-- ) l 

PolySum-»CoeffArray[ i ] = Polyi-»Coeff&árray[ i ] 

| + Poly2-»CoeffArray[ 1 Y; 

} 


图 3-20 MAE AE 


Booo 0 $3 













void 
MultPolynomial( const Polynomial Palyl, 

const Polynomial Poly2, Polynomial PolyProd > 
Í 


int i, j; 


ZeroPolynomia'( PoiyProd 3}; 
PolyProd->HighPower = Polyl->HighPower + Poly2->HighPower; 


if( PolyPrad--HighPower > MaxDegree ) 
Error( "Exceeded array size" ); 
else 
for( i = 0; i <= Polyl-»HighPower; i++ ) 
for( j = 0; j <= Poly2-»HighPower; j++ J 
PolyProd->CoeffArray[ i + j ] += 
Polyl-»toeffArray[ i ] * 
Poly2-»CoeffArray[ j l; 


图 3-21 两 个 多 项 式 相 乘 的 过 程 


另 一 种 方法 是 使 用 单 链 表 (singly linked listj。 客 项 式 的 每 一 项 含 在 一 个 单元 中 , JC Hox 
些 单元 以 次 数 递减 的 顺序 排序 。 例 如 , 图 3-22 中 的 链表 表示 P XM P2(X)。 此 时 我 们 可 
以 使 用 图 3-23 的 声明 。 


Lebel ele Lt 


P, ” 
[Hed Had PRSE [5/8 | - 
PP 


图 3-22 两 个 多 项 式 的 链表 表 不 


typedef struct Node *PtrToNode; 
struct Node 


jnt Coefficient; 

int Exponent; 

PtrToNode Next; 
H 


typedef PtrToNode Polynomial; /* Nodes sorted by exponent =y 





E323 ZR ADT 链表 实现 的 类 型 声明 


上 述 的 操作 将 很 容易 实现 。 惟 一 的 潜在 困难 在 于 ， 当 两 个 多 项 式 相 绞 的 时 候 所 得 到 的 多 
项 式 必须 合并 同类 项 。 这 可 以 有 多 种 方法 实现 , 我 们 把 它 留 作 练 习 。 
基数 排序 
使 用 链表 的 第 二 个 例子 叫做 基数 排序 (radix sort), Sak RATER EAEE (card 
sort), 因为 直到 现代 计算 机 出 现 之 前 , 它 一 直 用 于 对 老式 穿孔 卡 的 排序 。 
如 果 我 们 有 N 个 整数 , 范围 从 1 到 M( 或 从 0 到 M - D, 我 们 可 以 利用 这 个 信息 得 到 
B _ -种 快速 的 排序 , m 38 A AE AR (bucket sort). 我 们 留置 一 个 数组 , 称 之 为 Count, RDN 
54| M 并 初始 化 为 零 。 于 是 ， Count 有 M PAI BOM). 开始 时 他 们 都 是 空 的 。 当 A, REA 


hy RPAH 4] 
T] Count A; G1. ÆRA LA BBE HEU. SAFE RE Count, STAT MR ze. E. 
法 花费 OCM + N); EWH BEA. 如 果 MON), WISIS BETA OCN). 

基数 排序 是 这 种 方法 的 推广 ， 了 解 方法 含 多 的 最 容易 的 六 式 就 是 举例 说 明 。 设 我 们 有 
10 个 数 , 范围 在 0 到 999 zi], 我 们 将 其 排序 。 一 : 般 说 来 , 这 是 0 到 IN? — 1 问 的 N THE, p 
是 菜 个 常数 。 显 然 , 我 们 不 能 使 用 桶 式 排 序 , IPE AST. RRB ae et 
排序 。 自 然 的 算法 就 是 通过 最 高 {有效 )" 位 "(村 基数 N 所 取 的 位 ) 进 行 桶 式 排序 , 然后 是 对 
次 最 高 (有 效 ) 位 进行 , 等 等 ， 这 种 算法 不 能 得 出 下风 结果 , 但 是 ,如果 我 们 用 塘 低 {有效 ) 
“位 ?优先 的 方式 进行 桶 式 排序 , 那么 算法 将 得 到 正确 结果 。 当 然 , 有 可 能 多 于 - :个 数落 人 相 
同 的 桶 中 , 但 有 别 于 原始 的 桶 式 排序 . 这 些 数 可 能 不 同 , 因此 我 们 把 它们 放 到 一 个 表 中 。 注 
E. 所 有 的 数 可 能 都 有 某 位 数字 , 因此 如 果 使 用 简单 数组 表示 表 ,， 耶 么 每 个 数组 必然 大 小 为 
N. ARZ ER AE ON). 

F ei IF uH] 10 个 数 的 桶 式 排 序 的 具 蛋 做 法 - 本 例 的 输 人 是 04, 8, 216, 512. 27, 
729, 0, 1,343, 125( 前 10 个 立方 数 , 随机 排 州 )。 第 - 步 按照 最 低位 优先 进行 桶 式 排序 。 为 
使 问题 简化 , 此 时 操作 按 基 是 10 进行 , 不 过 一 般 并 不 做 这 样 的 假设 。 图 3-24 Don thx P668 
的 售 罢 ,， 凡 此 按 最 低位 优先 排序 得 到 的 上 去 是 0，1, 512, 343, 64, 125, 216. 27, 8, 729. WE 
再 按照 次 最 低位 { 即 十 位 上 的 数 宇 ?优先 进行 第 -: 趟 排序 ( 凯 图 3-25)。 第 二 趟 排序 输出 0，1， 
8. 512, 216, 125, 27, 729, 343, 64、 现 在 这 个 表 昆 按 两 个 最 小 的 位 排序 得 到 的 表 . 最 后 一 - 
未 彬 式 排 序 是 按 最 高 位 进行 ， 其 结 虹 显示 于 图 3-26, EUREN REO, 1, 8, 27, 64, 125, 


216, 343, 512, 729, 
ED 
| 0 | 1 2 








图 3-24 第 一 趟 霹 数 排序 后 的 桶 





图 3-25 第 二 趟 基数 排序 后 的 桶 





图 3.26 景 后 -不 某 数 排 序 后 的 捅 


力 使 算法 能 够 得 出 正确 的 结果 , 要 注意 惟一 出 错 的 可 能 是 如 来 两 个 数 出 自 间 -个 桶 但 顺 
序 却 是 错误 的 。 不 过 , 前 面 各 趟 排序 保证 了 当 几 个 数 进 人 一 个 桶 的 时 候 , 它们 是 以 排序 的 顺 
序 进 和 的， 该 排序 的 运行 时 间 是 OCPON + B). 其 中 P 是 排序 的 趟 数 ，N 是 要 被 排序 的 元 
索 的 个 数 , 而 BERR. BMP, B = No 





OF 





作为 一 个 例子 , 我 们 可 以 把 能 够 在 (32 位 ) 计 算 机 上 表示 的 所 有 整数 按 基数 排序 方法 排 
序 , 假设 我 们 在 大 小 为 2 的 桶 的 条 件 下 分 三 趟 进行 。 在 这 人 台 计 算 机 上 ， 该 算法 将 总 是 
O(N), 但 是 , 有 可 能 仍然 不 恕 我们 将 在 第 7 章 看 到 的 某 些 算法 有 效 ,， 因 为 包含 大 的 常数 . 
(我 们 记得 , logN 的 因子 不 都 这 么 大 , 而 该 算法 总 有 保存 链表 的 附加 开销 ,) 
L4 E. 

我 们 的 最 后 一 个 例子 阐述 链表 的 更 复杂 的 应 用 。 一 所 有 40 000 名 学 生 和 2 5001 REM 
大 学 需要 生成 两 种 类 型 的 报告 。 第 一 个 报告 列 出 每 个 班 的 注册 者 , 第 二 个 报告 列 出 每 个 学 牛 
注册 的 班级 。 

常用 的 实现 方法 是 使 用 二 维 数组 。 这 样 一 个 数组 将 有 1 亿 项 。 平 均 大 约 一 个 学 后 注册 三 
门 课程 ,因此 实际 上 右 意 义 的 数据 只 有 120 000 项 , A215 0.1%. 

现在 需要 的 是 列 出 每 个 斑 及 每 个 班 所 包 售 的 学 生 的 表 。 我 们 也 需要 每 个 学 生 及 其 所 省 册 
的 班级 的 表 。 图 3-27 显示 实现 的 方法 。 
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图 3-27 注册 问题 的 多 表 实 现 


正如 该 图 所 显示 的 , 我 们 已 经 把 两 个 表 合 成 为 一 个 表 。 所 有 的 表 都 各 有 一 个 表 头 并 日 都 古 
循环 的 ， 比 如 , 为 了 列 出 C3 班 的 所 有 学 生 , 我 们 从 C3 开始 通过 向 右 行进 而 遍历 其 表 。 第 一 个 
单元 属于 学 生 Si。 虽 然 不 存在 明显 的 信息 . 但 是 可 以 通过 跟踪 该 生 链 表 直 达到 该 表 表 头 而 确定 
该 生 的 信息 。 一 旦 找到 该 生 信息 , 我们 就 转 回 到 C3 的 表 ( 在 遍 厉 该 生 的 表 之 前 ,我 们 存储 了 
我 们 在 课程 表 中 的 位 置 ) 并 找到 可 以 确定 属于 S 的 另外 一 个 单元 ， 我 们 继续 并 发 现 S4 和 SS 
也 在 该 班 F。 对 任意 一 名 学 生 ， 我 们 也 可 以 用 类 似 的 方法 确定 该 生 注 册 的 所 有 识 程 。 

使 用 循环 表 节 省 空间 但 是 要 花费 时 间 。 在 最 坏 的 情况 下 ， 妇 果 第 一 个 学 生 注册 了 每 一 人 
BE, 那么 表 中 的 每 一 项 都 要 检测 以 确定 该 生 的 所 有 诬 程 名 。 因为 在 本 例 中 每 个 学 生 注册 的 
课程 相对 很 少 并 且 每 门 课程 的 注册 学 生 也 很 少 ， 最 坏 的 情况 羡 不 可 能 发 生 的 。 刀 果 怀 疑 会 产 
AE Vaya AK 248 (GE) ATOR BA BBS EARR I e xx fil H A A 
求 加 倍 , 但 是 却 简化 和 加 速 实现 的 过 程 。 

3.2.8 链表 的 游标 实现 
诸如 HASIC 和 FORTRAN 等 许多 语言 部 不 支持 指 针 。 如 果 需 要 链表 而 又 不 能 使 用 指 
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tt. ASA RIETI PRS, FATA BY HT BRA AB (cursor SEALE 

(Ete ARE] LRP A PES 

|. 数据 仓储 在 一 组 结构 体 中 ,每 PRE ARATE IR] e- -个 结构 体 的 措 针 

一 个 新 的 结构 体 避 以 通过 调用 malloc 而 从 系统 全 局 内 存 (globadl memory HS £j. 3E Hf 

通过 调用 free ifi EE DC. 

游标 法 必须 能 够 模仿 实现 这 两 条 特性 、 满 足 条 件 T 的 逻辑 方法 是 要 有 - -个 个 局 的 结构 体 
数组 ， 对 于 该 数组 中 的 任何 单元 ， 其 数组 下 栋 可 以 用 来 代表 一 个 地 址 -网 3-28 给 出 链 走 游 
标 实现 的 声明 。 





#1fndef 人 中 


| typedef int PtrToNade; 
typedef PtrToNode List; 
typedef PtrTaNode Position; 


void InitializeCursorSpace( void 3; 


List MakeEmpty( List L 3; 

int IsEmpty const List L 3; 

int Istast€ const Position P, const List L ); 
Position Find( ElementType X, const List L 3; 
void Delete( ElementType X, List Lo}; 

Position FindPrevious( ElementType X, const List L ); 
void Insert( ElementType X, List L, Position P 3; 
void DeleteList( List L 3; 

Position Header€ const List L 5; 

Position First( const List L 5; 

Position Advance( const Position P 5; 

ElementType Retrieve( const Position P 3; 


x endi f /* Cursor */ 
/* Place in the implementation file */ 
Struct Node 
ElementType Element; 
i Position Next; 
uH 


struct Mode Cursorspace[ SpaceSize ]; 


图 3.28 链表 游标 实现 的 声明 


现存 我 们 必须 模拟 条 件 2, 让 CursorSpace 数组 中 的 
单据 代行 malloc 和 free 的 职能 。 为 此 ， 我 们 将 保留 一 
3&( BI freelist). 这 个 表 由 不 在 任何 表 中 的 单元 铭 成 。 该 
表 将 用 单元 0 作为 表 头 。 其 初始 配置 在 图 3-29 P den. 
对 于 Next, 0 的 值 等 价 于 NULL Feet. CursorSpace 
Ag io f — I RE EST, 我 们 将 它 留 作 练 对 。 
为 执行 malloc 功能 , 将 (在 表 头 后 面 的 ) 第 一 个 元 素 从 
freelist 中 删除 。 为 了 执行 free 功能 , 我 们 将 该 单元 放 在 | 
freelist 的 前 端 。 网 3-30 表示 出 malloc 和 free hi d p 3c 
Qn. noe, 如 果 没有 可 用 空间 , 那么 我 们 的 例 程 通过 置 。 图 $329 PREN Casoria 
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P= 会 正确 地 实现 。 它 表明 再 没有 空间 可 用 ,并 且 也 本 以 便 CursorAlloc 的 第 二 行 成 为 空 
操作 (fno-op) .. 






| static Position 

| CursorAlloc( void ) 
{ 

| Position P; 


P = CursorSpace[ O ].Next; 
CursorSpace[ O ].Next = CursorSpace[ P i.Nexrt: 


return P; 








| } 
static void 
CursarFreet Position P ) 


CursorSpace[ P ].Next = CursorSpace[ 0 ].Next; 
Cursorspace{ O ].Next = P; 


i 


Ej 3-30 BER CursorAlloc 和 CursorFree 


有 了 这 些 , 链表 的 游标 实现 就 简单 了 了。 次 了 前 后 一 致 ， 
我 们 将 用 一 个 头 结 点 实现 我 们 的 链表 。 作 为 一 个 例子 , 在 图 
3.31, mE L 的 值 是 5 而 MM 的 值 为 3, W 工 表示 链表 a, 
b, e, 而 M de tix c, d, fo 

Ay T S o Fate Scot de a oce es E, 我 们 必须 传递 各 
返回 与 指针 实现 时 相同 的 参数 。 这 些 例 程 很 简单 。 图 3-32 是 
一 个 测试 表 是 香 为 空 表 的 函数 。 图 3-33 实现 对 当前 位 置 是 否 
是 表 的 末尾 的 测试 。 图 3-34 中 的 函数 Find 返回 表 工 中 的 下 
的 位 置 。 实 现 删除 的 程序 在 图 3-35 中 给 出 。 再 有 , 游标 实现 
的 接口 和 指针 实现 是 一 样 的 。 最 后 , 图 3-36 表示 Insert WF 
标 实 现 - 
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13-31 链表 游标 实现 的 例 


/* Return true if L is empty */ 
int 
IsEmpty( List L ) 
{ 
return CurserSpace[ L ].Next == 0; 


} 





图 3.32 ”测试 一 个 链表 是 否 为 空 的 函 救 一 一 游标 实现 


/* Return true if P is the last position in list L afi 
/* Parameter L is unused in this implementation */ 


int 


IsLast( Position P, List L J 


return CursorsSpace[ P ].Next == 0; 


} 





图 3.33 测试 P 是否 是 链表 的 末尾 的 函 歼 一 一 游标 实现 
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/* Return Position of X in L; O if not found */ 
/* Uses à header node */ | 


Position 
Find( ElementType X, List L ) 


| 
| 
| | 
| i 
i Position P; 
| 


fF Ut P = Cursorspace; L ]l.Next; 

f™ 2t/ while( P && CursorSpace[ P ].Element != X } 
| /*5m»/ P = CursorSpace[ P ].Next; 
| /* 4*/ return P; 


3-34 PE Find 





游 怀 实现 





/* Delete first occurrence of X from a list */ 
/* Assume use of a header node */ 


vo1d 
Delete( ElementType X, List L ) 


Position P, TmpCell; 

P = FandPrevaous( X, L 1 

ift !TsLast( P, EL) )  /* Assumption af header use */ 

{ /* X is found; delete jit */ 
TmpCe)] = CursorSpace[ P ]. Next: 


CursorSpace[ P ].Next = CursorSpace[ Tmpce!l ].Next; 
CursorFfree£ Tmpte!l 3, 


! | 


图 3.35 ”对 链表 进行 删除 操作 的 例 程 Delere 一 一 游标 实现 


- — «= —— 





/* Insert (after legal position P) */ 
/* Header implementation assumed */ 
/* Parameter L is unused in this implementation * y 


void 
Inserti Elementiype X, List L, Position P ) 


{ 
Position TmpCell; 


l*/ Tmptell = CursorAlioc( 5; 
f* 2*7 ifi Tmpcell == 0 3 
/* 3*/ FatalError( "Out of space!!!" j; 
f* arf CursorSpace[ TmpCell ].Element = X; 
ft $9j CursorSpace[ TmpCell }.Next = CursorSpace[ P ].Néxt; 
ir 6*/ CursorSpace[ P ].Next = TmpCell; 


in 
* 








图 3.36 对 链表 进行 插 人 操作 的 例 释 [Insert 一 一 游标 实现 


其 祭 个 程 的 编码 类 似 。 关 键 的 一 点 是 , 这 些 例 程 遵循 ADT 的 规范 。 它 们 采用 特定 的 受 
县 并 执行 特定 的 操作 。 实 现 对 用 户 是 透明 的 。 游 标 实现 可 以 用 来 代替 链表 实现 , 实际 上 在 程 
这 的 其 余部 分 不 需要 恋 化 。 由 于 缺少 内 存 管理 例 释 , 因此 , 如 果 运 行 的 Find 函数 相对 很 少 ， 
则 游标 实现 的 速度 会 显著 加 快 。 
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freelist 从 字 面 上 看 表示 一 种 有 趣 的 数据 里 构 。 共 freelist 删除 的 单元 是 刚刚 由 frec 让 在 

那里 的 单元 。 因 此 , 最 后 被 放 在 freelist 的 单元 是 被 最 先 合 走 的 单元 。 有 一 -种 数据 结构 也 兵 有 
这 种 性 质 , MAER (stack), 它 是 下 一 节 要 讨论 的 课题 。 


3.3 $% ADT 


3.3.1 栈 模 型 

栈 (stack) 是 限制 插 人 和 删除 只 能 在 -- 个 位 置 上 进行 的 表 , i, HY 
顶 {top)。 对 栈 的 基本 操作 有 Push( 进 栈 ) 和 Pop CHI ER). 前 者 相当 于 搬入 , 后 者 则 是 删除 最 
后 插 人 的 元 索 。 最 后 插 人 的 元 素 可 以 通过 使 用 Top 例 程 在 执行 Pop 之 前 进行 考查 。 对 空 栈 
进行 的 Pop 或 Top 一 般 被 认为 是 栈 ADT 的 错误 。 田 一 方面 ， 当 运行 Push MASS E 
个 实现 错误 , 但 不 是 ADT 错误 。 ` 










Pops) Pushix, 3) 


Fap($) 


EH 237 栈 模 型 : 通过 Posh 向 栈 输 入 , 通过 Pop 从 栈 输 出 


栈 有 时 又 叫做 LIFO( 后 进 先 出 ) 表 。 在 图 3-37 
中 描述 的 模型 只 象征 者 Push 是 输入 操作 而 Pop 和 
Top 是 输出 操作 。 普通 的 清空 栈 的 操作 和 判 疡 是 
否 空 栈 的 测试 都 是 栈 的 操作 指令 系统 的 一 部 分 ， 
但 是 , 对 栈 所 能 够 做 的 ,基本 上 也 就 是 Push Fl 
Pop 操作 。 

El 3.38 表示 在 进行 苦于 操作 后 的 一 个 抽象 的 
栈 。 一 般 的 模型 是 , 存在 某 个 元 素 位 于 栈 顶 , 而 该 
元 素 是 惟 -- 的 可 见 元 素 。 图 3.38 REN: 只 有 栈 顶 元 素 是 可 访问 的 
3.3.2 ROR 

由 于 栈 是 一 个 表 , 因此 任何 实现 表 的 方法 都 能 实现 栈 。 RATATAT A 
法 ,一 种 方法 使 用 指针 , 而 男 一 种 方法 则 使 用 数组 。 但 是 , 正如 我 们 在 前 一 节 和 着 到 的 ,如果 
使 用 好 的 编程 原则 ， 那么 调用 例 程 不 必 知 道 使 用 的 是 哪 种 方法 。 
栈 的 链表 实现 

栈 的 第 一 种 实现 方法 是 使 用 单 链 表 。 我 们 通过 在 表 顶 端 插 人 来 实现 Push, 通过 删除 表 
顶端 元素 实现 Pop. Top 操作 只 是 考查 表 项 端 元 素 并 返回 它 的 值 。 有 时 Pop 操作 和 Top 操 
WESTA- 我们 本 可 以 使 用 前 一 节 的 链表 例 程 , 但 为 了 清楚 起 见 我 们 还 是 从 头 开 始 重 写 栈 
的 例 程 。 

首先 , 我 们 在 图 3-39 中 给 出 一 些 定义 。 实现 栈 要 用 到 一 个 表 头 。 图 3-40 表明 , WAE 

56, 栈 与 测试 空 表 的 方式 相同 。 
(i 创建 -… 个 空 酚 也 很 简单 ,我 们 只 可 建立 一 个 头 结 点 ，MakeEmpty 设置 Neat TESTI 
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#ifndef Stack h 


struct Node; | 
typedef struct Node “PtrToNode; 
| typedef PtrToNode Stack: | 








, int IsEmpty( Stack 5 3; 
| Stack CreateStack( void j; l 
void DisposeStack( Stack $ 3}; 
|. void MakeEmptv( Stack 5 3; | 
| void Push( ElementType X, Stack 5 3; 
'  ElementType Top( Stack 5 }; 
void Popi Stack 5 3: 


Sendif v= _Stack_h */ 


/* Stack implementation is a Tinked list with a header ^/ 
struct Node 


| 了 


| /* Place in implementation file */ | 


1 

| ETementType Element; 
PirToNode Next: 

EF 

L au LL | 


图 3-39 H ADT REX SEL OK RU ps H 


int 
lsEmpty( Stack & 3 


4 


return S->Next == NULL; ; 
| | 
[E 340 测 斌 栈 是 否 空 楼 的 例 程 一 一 链表 实现 
NULLI 3-41), Push 二 作为 向 链表 前 端 进 行 插 和 人 而 实现 的 ， Hou, AER nm fi y He 
(WE 3-42). Top 的 实施 是 道 过 考查 表 在 第 一 个 位 置 上 的 元 素 而 完成 的 { 见 涛 3-43)。 ER, 
Pop 是 通 过 删除 表 的 前 端的 元 素 SCE AD CDL ES 3-44)。 








Stack 
CreateStack( void j 


1 
Stack 5; 


S5 = malloc( sizeof( struct Node ) 3; 
iff 5 == NULL 7 
FatalError{ "Out of space!!!" J; 
| = == NULL: 
MakeEmpty( 5 J; 
return 5; 


F 


void 
MakeEmptyť Stack 5 ) 


if€ 8 == NULL } | 
Errori "Must use CreateStack first" 3; 
else 
while( 'IsEmpty( 5 9 3 
Pant S 3; 





图 3-41 ”创建 一 个 空 栈 的 例 程 一 一 链表 实现 


48 gsx 

















void 
Push( ElementType X, Stack 5 3 
1 


PtrToNode TmpCe!i; 


TmpCell = malloc( sizeof( struct Node ) 5; 
if( TmnCel! == NULL 3 
FatalErrar( “Gut of space!!!" 5; 
else 
{ 
TmpCalt->Elament = X; 
TmpCel}->Next = 5->Next; 
5-»Maxt = TmpCaell: 


图 3-42 Push 进 栈 的 便 程 一 一 链表 实现 


ElementType 
Topt Stack $ ) 
{ 
itt tIsEmpry¢ $ ) 3 


return S-»Next-»Element; 
Error( "Empty stack" ); 
return 0; /* Return value used to avoid warning */ 





[E] 3.43 返回 栈 项 元 素 的 例 程 一 一 链表 实现 


void 
Pop( Stack 5 ) 


PtrToNode FirstCell; 


if( IsEmpty¢ $ 3 3 

Error( "Empty stack" }; 
else 
1 


Firstceil = S->Next; 
S->Next = 5-2Mext--Next; 
free( FirstCelt 3; 


} 
} 





图 3-44 ”从 栈 弹 出 元 素 的 例 程 一 一 链表 实现 


很 清楚 ,所 有 的 操作 均 花 费 常数 时 间 ， 因为 这 些 例 程 没 有 任何 地 方 涉 及 到 栈 的 大 小 ( 空 
栈 除外 ), 更 不 用 说 依 束 于 栈 大 小 的 循环 了 。 这 种 实现 方法 的 缺点 在 于 对 rmalloc 和 free 的 凋 
用 的 开销 是 昂贵 的 , 特别 是 与 指针 操作 的 鲍 程 相 比 尤其 如 此 。 有 的 缺点 通过 使 用 第 一 个 栈 可 
以 避免 , 该 第 二 个 栈 初 始 时 为 空 栈 。 当 一 个 单元 从 第 一 个 栈 弹 由 时 ,， 它 只 是 被 放 到 了 第 二 个 
栈 中 。 此 后 ， 当 第 -- 个 栈 需要 新 的 单元 时 , 它 首先 去 检查 第 二 个 酚 。 
栈 的 数组 实现 

另 一 种 实现 方法 避免 『 指 针 并 且 可 能 是 更 流行 的 解决 方案 。 这 种 策略 的 惟一 潜在 危害 是 
我 们 需要 提前 声明 一 个 数组 的 大 小 。 一 般 说 来 , 这 并 不 是 个 问题 , 因为 在 典型 的 应 用 程序 
中 ， 即 使 有 相当 多 的 栈 操 作 , 在 任 一 时 刻 栈 元 素 的 实际 个 数 从 不 会 太 大 。 声 明 一 个 数组 足够 
大 而 不 至 于 浪费 太 多 的 空间 通常 并 没有 什么 困难 。 如 果 不 能 做 到 这 一 点 ， 那么 节省 的 做 法 是 
使 用 链表 来 实现 。 
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H -个 数组 实现 栈 是 很 简单 的 。 每 -个 栈 有 一 个 ToepOfStack. x FERREE- OA 
TEAS RE a HAE). OR SOE PLR X ERA BOR FETE TopOfStack fitt 1, IE Be 
Stack TopOfStack ! = X. HIP Stach EUR RAEKFRBSSXSH . Ay TR oc a FT] Bk OI 
ULA Stack? TopOfStack IR TopOfStack RY. 当然， t T TE AMA E S PR. A Stack 
数组 利 TopOfSrach 是 代表 一 个 栈 的 结构 的 一 部 分 。 使 用 全 局 变量 和 加 定名 字 来 表示 这 种 (或 
任 --) 数 据 结构 几乎 总 是 有 害 的 , AATEA SSCA PP BBR ET OTR. ae 
裤 陈 程序 的 时 候 , 你 应该 尽 订 能 紧密 地 遵循 模 由 ,这样 ， 除 一 些 栈 例 程 外 ,你 的 程序 的 任何 
划分 痢 没 有 存 取 被 每 个 栈 列 含 的 数 纪 或 乒 顶 (top-of -stack) 变 量 的 可 能 。 这 对 所 有 的 APT 探 
作 帮 是 成 立 的 ， @ Ada WC- 2 这样 的 现代 程序 设计 调 言 实际 上 都 能 够 实施 这 个 法 则 ， 

注意 , CORRE ALA ET RI 41. ud AE CIE Beg EXIT AL Gt, (EGER AL aE 
A. ATRA GAL SURE EEL BEE. 则 (整数 的 ) Pash 和 Pop 都 可 以 号 成 一 条 
机 器 指 今 . 最 现代 化 的 计算 机 将 栈 操 作 作 为 它 的 指令 系统 的 一 部 分 , 这 个 事实 强化 了 这 性 一 
种 观念 , 即 栈 很 可 能 是 在 计算 机 科学 中 在 数组 之 后 最 基本 的 数据 结构 ， 

-个 影响 栈 的 执行 效率 的 问题 是 错误 检测 。 我 们 的 链表 实现 中 是 仔细 地 检查 错 座 的 ， IE 
du FE PER ES, 对 空 栈 的 Pop 或 是 对 满 栈 的 Push 都 将 超出 数组 的 界限 并 引起 称 序 导语 . 
ab ok, 我 们 订 愿 意 出 现 这 种 情况 。 介 是. 如 哩 把 对 这 些 条 件 的 检测 效 到 数组 实现 过 程 中 . ab 
就 很 可 能 要 花费 像 实 际 栈 操作 那样 多 的 时 间 。 让 于 这 个 原因 , 除非 在 错误 处 理 极其 重要 的 场 
合 { 如 在 操作 系统 中 ) ,一般 在 栈 例 程 中 省 去 错误 检测 就 成 了 普通 的 惯用 于 法 虽然 在 多 数 傅 
况 直 你 可 能 通过 声明 一 个 栈 天 到 不 至 于 使 得 操作 溢出 ,并 保证 使 用 Pop BIERE E A Pop 
- .个 空 栈 而 侥幸 避免 对 错误 的 检测 . 但 是 ,这 充其量 只 不 过 是 使 得 程序 得 以 还 第 运行 而 已 ， 
特别 是 当 程序 很 太 并 且 基 由 不 止 一 个 人 编写 或 是 分 着 十 次 写成 的 时 候 。 因 为 栈 操作 花 党 如 此 
快 的 常数 时 间 ， 所 以 一 个 程序 的 主要 运行 时 间 很 少 会 花 在 这 些 例 程 上 面 。 这 就 意味 首 , AEN 
错误 检测 - -最 是 不 有 要 的 。 你 应 该 随时 编写 错误 检测 的 代码 ; 如 果 它 们 元 长 , 那么 当 它 们 确实 
耗费 太 客 时 间 时 你 总 可 以 将 它们 去 掉 {eomment them out), 在 进行 上 而 的 评述 以 后 . FRAT XN 
在 就 可 以 编写 用 数组 实现 -- 般 的 栈 的 例 程 了 。 

在 图 3.45 中 See( 栈 ) 被 定义 为 指向 一 个 结构 体 的 指针 。 该 线 构 体 包含 TopOfStack W 
Al Capacity 域 。 一 旦 知道 最 大 容量 ， 则 该 楼 即 可 规 动 态 地 确定 。 图 3-46 BI NAR AE 
的 最 天 值 的 栈 。 第 3 行 到 第 5 行 指定 该 栈 的 结构 , 而 第 6 行 到 第 8 行 则 指定 乒 的 数组 . 第 9 
行 和 第 10 行 初始 化 域 TopOfStack AUR Capacity. 栈 的 数组 不 需要 初始 化 。 第 11 行 返回 栈 。 

为 了 释放 乒 结构 应 该 编写 例 程 DisposeStack ， 这 个 例 租 首 先 释放 栈 数组 ， 然 后 轰 放 栈 疆 
向 体 ( 兄 图 3-47)。 由 于 CreateStach 在 栈 的 数组 实现 中 需要 一 个 参数 ， 而 在 链表 实现 中 不 需 
发 参数 . 央 此 若 在 后 者 的 实现 中 不 添加 哑 元 的 话 , 那么 这 个 使 用 栈 的 例 程 就 需要 知道 正在 使 
出 的 星 哪 种 实现 方法 。 不幸 的 是 . 效率 和 软件 理想 主义 常常 发 生 冲 突 。 

我 们 已 经 假设 所 有 的 栈 均 处 理 相 同类 型 的 元 素 。 在 许多 的 编程 语言 收 、 如 果 存 在 个 同类 
TE ARE. 那么 我 们 就 需要 为 每 种 不 同类 型 的 栈 重 新 编写 一 食 栈 的 新 的 例 程 .同时 给 每 套 俩 大 
册子 不 同 的 名 字 。 在 C+ + 中 提供 了 更 彻底 的 方法 , 它 允 许 我 们 编写 E - 般 的 栈 例 程 , 对 
任何 类 者 的 栈 部 能 正常 运行 。C+ + 还 允许 儿 种 不 同类 型 的 栈 保留 相同 的 过 程 和 函数 名 ( 刀 
Push 和 Pop), 通过 检验 证 调 例 程 的 类 型 ,编译 程序 可 决定 使 用 哪些 例 程 。 

下 进行 了 上 面 的 六 述 以 后 ,现在 我 们 就 来 重 写 五 个 栈 例 程 。 我 们 将 以 纯 ADT. RAEE 
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/*l1*/ 


#afndef  5rack h 


struct StackRecord; 
typedef struct StackRecord *Stack; 


int IsEmpty( Stack 5 3; 

int IsFuli( Stack 5 »; 

Stack CreateStack( int MaxElements }: 
void Bisposestack( Stack 5 >; 

void MakeEmpty( Stack 5 ); 

void Pusht ElementType X, Stack $ J; 
Elementtype Top( Stack 5 3; 

void Pop( Stack S ); 

Element?type TapAndPop( Stack 5 ); 


+#endif  /* Stack h */ 


/* Place in implementatioin file */ 

/* Stack implementation is a dynamically allocated array */ 
xdefine £mptyTOS © -1 1 

#define MinStackSize ( 5 > 


struct StackRecord 


int Capacity; 
int TopOfStack; 
FlementType "Array; 
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Stack 
CreateStack( int MaxElements ) 


Stack 5; 


if( MaxElements < MinStackSize ) 
Error( "Stack size is tac small" 5; 


S = malloc( sizeof( struct StackRecord ) jJ; 
if( S == NULL ) 
FatalError( "Out of space!!!" 5; 


S-»Array = malloc( sizeof( ElementType 3 * MaxElements ); 
iff 5-»Array == NULL } 
FatalError( "Out of space!!!" J; 
&-»Capacity = MaxElements; 
MakeEmpty( S ); 


return 5; 
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woid 
DisposeStack( Stack 5 } 
1 


ifC 5 t= NULL J 


free( S-»Array ); 
free( 5 3; 
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数 和 过 程 的 题名 外 观 等 同 王 链表 实现 。 这些 例 程 本 身 是 韭 第 简单 的 , H A Pde 
述 { 见 图 3-48 到 图 3-52). 


int 


IsEmpty{ Stack 5 ) 
í 


return S->TopOGfStack == EmptyTOS; 





i 
| 68 | 
图 3.48 RN — PRE Ss BE Pe A 3c) | | 
L69 | 


void 
MakeEmpty( Stack 5 3 


S->TopofStack = EmptyTOs; 





图 349 GG — RR BD A 


.. 
| void 

Pushé ElementType X, Stack 5 ) 
， 4 

| ift IsFull£ 5 ) ) 





Errori "Full stark" J; 


else 
| S->Array[ ++5->TapOfStack ] = X; 


Po 


图 3-50 进 栈 的 例 程 一 一 数组 实现 





ElementType 
Top( Stack 5 ) 
1 
if( !IsEmpty( $ ) ) 
return 5-»Array[ 5-»TopOfStack J; 
Error( "Empty stack" >; 
return 0; /* Return value used to avoid warning */ 


图 3-51 将 栈 顶 返回 的 例 程 一 一 数组 实现 


void 
Pop( Stack 5 ) 
1 
iff IsEmpty( 5 ) ) 
Errort "Empty stack" J; 
else 


S-»TopOfStack--; 





图 3.52 从 楼 弹出 元 索 的 例 程 一 UB SCR 70 


Pop 偶尔 写成 返回 弹出 的 元 素 ( 并 使 栈 改 变 ) 的 函数 。 虽然 当前 的 想法 是 函数 不 应 该 改变 
其 输入 参数 , 但 是 图 3-53 表明 这 在 中古 最 方便 的 方法 。 


mee 


ee g3* 












Element] ype 
TeopAndPop( Stack 5 ) 
i 





ift !IsEmpty( $ 5 ) 
return $-»Array[ $--TopOfStack-- ]: 
Errori "Empty stack" }; 
return 0; /* Return value used to avoid warning */ 


} 


图 3-53. 给 出 栈 顶 元 素 并 从 栈 弹出 的 例 程 一 数组 实现 


33.3 应 用 

ERAR, 如果 我 们 把 操作 限制 于 一 个 表 , 那么 这 些 操作 会 执行 得 很 快 。 然 而 , 令 人 惊 
奇 的 是 , 这 些 少量 的 操作 非常 强大 和 重要 。 在 栈 的 许多 应 用 中 , 我 们 给 出 三 个 例子 ,第 三 个 
实例 深刻 说 明 程序 是 如 何 组 织 的 。 
平衡 符号 

编译 器 检查 你 的 程序 的 语法 错误 , 但 是 常常 出 于 缺少 一 个 符号 (如 遗漏 一 个 花 括号 或 是 
注释 起 始 符 ) 引 起 编译 器 列 出 上 百 行 的 诊断 . 而 真正 的 错误 并 没有 找 出 ， 

在 这 种 情况 下 一 个 有 用 的 工具 就 是 检验 是 否 每 件 事情 都 能 成 对 出 现 的 一 个 程序 。 于 是 ， 
短 一 个 右 花 括 导 、 右 方 括号 及 右 圆 括号 必然 对 应 其 相应 的 左 括号 。 序列“[()]" 是 合法 的 , 但 
“[( ] )" 是 错误 的 。 显然, 不 值得 为 此 编写 一 个 大 型 程序 ,事实 上 检验 这 些 事情 是 很 容易 的 ， 
为 简单 起 见 ， 我 们 仅 就 圆 括号 、 方 括号 和 花 括号 进行 检验 并 忽略 出 现 的 任何 其 他 字符 。 

这 个 简单 的 算法 用 到 一 个 栈 , SEMT: 


做 -一 全 空 栈 。 读 入 字 特 直到 文件 尾 。 如 彬 字符 是 一 个 开放 鞍 号 ， 则 将 其 推 入 找 中 - 
如 果 池 符 是 一 个 封闭 糙 号 ， 则 当 栈 空 时 报错 。 否 则 ， 将 栈 元 素 弹 出 。 如 果 弹 出 的 符号 不 
是 对 应 的 开放 桂 号 ， 则 报错 。 在 文件 是 ,如果 栈 非 空 则 报 钳 。 


你 应 该 能 够 确信 这 个 算法 是 会 正确 运行 的 。 很 清楚 , 它 是 线性 的 , 事实 上 它 只 需 对 箱 八 
进行 一 趟 检验 。 因 此 , 它 是 在 线 (on-line) 的 , 是 相当 快 的 。 当 报错 时 , 决定 如 何 处 理 需要 做 ， 
一 些 附 加 的 工作 一 一 例如 判断 可 能 的 原因 。 

ERRAR 

假 疫 我 们 有 一 个 便携 计算 器 并 想 要 计算 一 趟 外 出 购物 的 花费 。 为 此 , 我 们 将 一 列 数据 相 
加 并 将 结果 乘 以 1.06; 它 是 所 购物 品 的 价格 区 及 附 如 的 地 方 税 。 如 果 购 物 各 项 花 销 为 4.99， 
5.99, $016.99, 那么 输入 这 些 数据 的 自然 的 方式 将 是 

4.99 + 5.99 + 6.99 * 1.06 = 

随 着 计算 器 的 不 同 , 这 个 结果 或 者 是 所 要 的 答案 19.05, 或 者 是 科学 答案 18.39。 最 简单 
的 中 功能 计算 器 将 给 出 第 一 个 答案 , 但 是 许多 先进 的 计算 器 是 知道 滋 法 的 优先 级 是 局 于 加 


法 的 。 
5 Hg. 有 些 项 是 需要 上 税 的 而 有 些 项 则 不 是 , 因此 ,如果 只 有 第 一 项 和 最 后 一 项 是 
要 上 税 的 ,那么 


4.99 * 1.06 + 5.99 + 6.99 * 1.06 = 
将 在 科学 计算 器 上 给 出 正确 的 答案 (18.69) 而 在 简单 计算 器 上 给 出 错误 的 答案 (19.37)。 科学 
计算 器 一 般 包含 括号 ， 因 此 我 们 总 可 以 通过 加 括号 的 方法 得 到 正确 的 答案 , BEERA 


(8. TE fe FA SY 


Fae te Bic FE RII 

Pd ds LESS WU RT EA RE 4.90 &1 1.06 FABRE FEY A), PREAH 5.99 ALA, Hn, BE 
TERRE A AQ 我 们 再 将 6.99 f0 1.06 MEIRE A. 最 后 将 AL Fi Ao 加 :并 将 最 后 
URNA AS. 我们 可 以 将 这 种 操作 咕 序 书写 如 下 : 

4.99 1.06 * 5.99 + 6.99 1.06 * - 

ix ie iA HABES 58 postfix 8 3£ 2 2 (reverse Polish idik. BOR ELJ fx REID 
ü| ren gp. 计算 这 个 问题 最 容易 的 方法 是 使 用 - TEES UA Le TE BU HEAR 
中 ;在 遇 到 - :个 运算 答 时 该 算 符 就 作用 二 从 该 栈 强 出 的 酚 个 阁 ( 符 导 ) pb. ERE A HR 
dto (EAD. 后缀 表达 式 

O524 7,8 © + 3a * 
计算 如 下 : APO TE SERRA REP UT FE e 
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"Tasks a 所 以 3 和 2 Aie, 并 是 它 们 的 和 5 REAP. 72; 
— F ee 


| 
|... Topuk MI 3 
| 4s 
dL d 


| TapOrMzck = 8 
| 


PE 
BcWu--4-"u. 因此 8 和 5 弹出 , FHS * 8 = 40 进 栈 : 
rT 








RR. BG. 


| 
| dopOMSrwk = | 
uH 


eae Ba, 央 此 4 各 和 5 被 弹出 , FEL S 1 40 = 45 HER. 


一 下 


TSca ge — d; 
| i 6 
—————— 








现在 将 3 | RARE. 


Ez 


Fa] 


TopOfStack — | 


3 | 
45 | 
6 





然后 ”+ "使 得 3 和 45 从 栈 中 弹出 ,并 将 453 + 3 = 48 压 人 栈 中 。 


TopOfSeack 





最 后 ， 遇 到 一 个 “* ”号 ， 从 楼 中 弹出 48 和 6, 将 结果 6 * 48 = 288 压 进 栈 中 。 
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计算 一 个 后 绎 表达 式 花费 的 时 间 是 O(N), 因为 对 输入 中 的 每 个 元 素 的 处 理 都 是 由 一 些 
栈 操作 组 成 从 而 花费 常数 时 间 。 该 算法 的 计算 是 非常 简单 的 。 注 意 ， 当 一 个 表达 式 以 后 颁 记 
寻 给 出 时 , 没有 必要 知道 任何 优先 规则 。 RETR EAR 
中 绿 到 后 经 的 转换 

栈 不 仅 可 以 用 来 计算 后 缀 表达 式 的 值 ， 而 且 我 们 还 可 以 用 栈 将 一 个 标准 形式 的 表达 式 
(或 叫做 中 组 式 (infix) ) 转 换 成 后 缀 式 。 我 们 通过 只 人 允许 操作 + ，* ， G), 并 坚持 普通 的 优先 
级 法 则 而 将 一 般 的 问题 浓缩 成 小 规模 的 问题 。 我 们 还 要 进一步 假设 表达 式 是 合法 的 。 设 我 们 

ath#*ct(d*et{f)*g 
转换 成 后 级 表达 式 。 正 确 的 答案 是 

abc* +de*ft+ge* + 

当 读 到 一 个 操作 数 的 时 候 , 立即 把 它 放 到 输出 中 。 操 作 符 不 立即 输出 ， 从 而 必须 先 存 在 
某 个 地 方 。 正确 的 做 法 是 将 已 经 见 到 过 的 操作 符 放 进 栈 中 而 不 是 放 到 输出 中 。 当 遇 到 左 圆 括 
号 时 我 们 也 要 将 其 推 信 栈 中 。 我 们 从 一 个 空 栈 开 始 计算 。 

如 果 见 到 一 个 右 括号 , 那么 就 将 栈 元 素 弹 出 , 将 弹出 的 符号 写 出 直到 我 们 通 到 一 个 (对 
应 的 ) 左 括号 , 但 是 这 个 左 括号 只 被 弹出 , 并 不 输出 。 

如 果 我 们 见 到 任何 其 他 的 符号 (“+",“*”,“(”)， 那么 我 们 从 栈 中 弹出 栈 元 亲 直 到 发 
现 优 先 级 更 低 的 元 素 汐 止 。 有 一 个 例外 : 除非 是 在 处 理 一 个 “)” 的 时 候 , 否则 我 们 绝 不 从 栈 
中 移 走 "("。 对 于 这 种 操作 ,，“ 二 ”的 优先 级 最 低 ， 而 “(" 的 优先 级 最 高 。 当 从 栈 弹 出 元 素 的 工 
作 完 成 后 , 我 们 再 将 操作 符 压 人 栈 中 。 

最 后 ， 如 果 我 们 读 到 输入 的 末尾 ， FRR ICR BU APRESS TK, 将 符号 写 到 和 输 


出 中 。 
为 了 理解 这 种 算法 的 运行 机 制 , 我 们 将 把 上 面 的 中 级 表 达 式 转换 成 后 缓 形式。 首先 ，a 
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RIA, FR CR. EX. “+ ”被 读 人 并 被 放 信 栈 中 。 接 着 足 b 读 人 并 流向 输出。 这 
一 -时刻 的 状态 如 下 ， 





+ | ab 
Stack Output 
这 时 “* "号 读 人 入 。 操 作 符 栈 的 栈 顶 元 素 比 "* “的 优先 级 低 , 故 没 有 和 输出, C " 进 栈 ， 接 看 , c 
被 污 人 并 输出 。 至 此 , RITA 


NE 

Stack Output 
后 面 的 符 叶 居 +, EE FR RIAR, 需要 将 "* ”从 栈 弹出 并 放 到 输出 中 ; 弹 
出 栈 中 剩 下 的 “+ "号, 该 算 符 不 比 刚刚 遇 到 的 + "号 优先 级 低 而 是 有 相同 的 优先 级 ; 然后， 
将 刚刚 遇 到 的 “+ "号 压 人 楼 中 。 


十 abe * + 
Stack Output 
下 -个 被 读 到 的 符 续 是 一 个 “(”, 由 于 有 最 高 的 优先 级 , 因此 它 被 放 进 栈 中 。 然 后 , d 读 人 并 
输出 。 


{ 
+ | abc*«d i75] 


Stack Output 
继续 进行 ,我 们 又 读 到 一 个 "* ”。 除 非 正 在 处 理 闭 括 导 , 香 则 开 括 号 不 会 从 栈 中 弹出 , 因此 
没有 输出 。 下 一 个 是 e, 它 被 污 人 并 输出 。 


x 


m 
' abc*+de 
stack Qutput 


再 往 后 读 到 的 符号 是 "+ "。 我 们 将 * “弹出 并 和 输出， 然后 将 “+ EARP RAR, 我 们 读 
到 了 并 输出 . 


中 
Stack Output 


现在 , 我 们 读 到 一 个 “)”, RTE AA CRH, 我 们 将 一 个 “+ 号 箱 出 。 


+ abcttde*f+ | 


Stack Output 


下 面 又 污 到 :一 个 * *”, BEREARI. R g 被 读 入 并 和 输出。 


[a 


r 


?0 eee B3e 





一 -| [a5c*sde Tg | 
Stack Output 
现在 输入 为 空 ， 因 此 我 们 将 栈 中 的 符号 全 部 弹出 并 和 输出 , HIRERE BR 
B 
Stack Output 


与 前 面相 同 ， 这 种 转换 只 需要 OUN) 时 间 并 经 过 一 趟 输入 后 工作 完成 。 我 们 可 以 通过 指 
定 减法 和 加 法 有 相间 的 优先 级 以 及 乘法 和 除法 有 相同 的 优先 级 而 将 减法 和 除法 添加 到 指令 集 
中 去 。 一 种 巧妙 的 想法 是 将 表达 式 "a - b- [Hab — < 一 "而 小 是 转换 成 "abc - - 。 
我 们 的 算法 做 了 正确 的 工作 ,因为 这 些 操 作 符 是 从 左 到 右 结合 的 。 一 般 情 部 未 必 邵 此， 比如 
下 面 的 表达 式 就 是 从 右 到 左 结合 的 : 22 = B= 256, WK P= 64。 我 们 将 把 取 和 宕 运算 添加 
到 指令 集中 的 问题 留 作 练 习 。 
函数 调用 

检测 平衡 符号 的 算法 提供 一 种 实现 函数 调用 的 方法 。 这 里 的 问题 是 ， 当 调用 一 个 新 泪 数 
iH, 主 调 例 程 的 所 有 局 部 变量 需要 由 系统 存储 起 来 ,否则 被 调用 的 新 函数 将 会 覆 次 调用 例 称 
的 变量 。 不 仅 如 此 , 该 主 调 例 程 的 当前 位 置 必须 要 存储 ,以 便 在 新 函数 运行 完 后 知道 向 哪里 
转移 。 这 些 变量 一 般 由 编译 器 指派 给 机 器 的 寄存 器 , 但 存在 某 些 冲 突 ( 通 常 所 有 的 讨 程 都 将 
某 些 变量 指派 给 1 斗 寄存 器 ), 特别 是 涉及 递归 的 时 候 。 该 问题 类 似 于 平衡 符号 的 原因 全 于 ， 
肾 数 调用 和 哨 数 返回 基本 上 类 似 于 开 插 号 和 闭 括 导 , 二 者 想法 是 一 样 的 ; 

当 存 在 函数 调用 的 时 候 , 需要 存储 的 所 有 重要 信息 , 诸如 寄存 器 的 值 (对 应 变量 的 名 子 ) 
种 返回 地 址 ( 它 可 从 程序 计数 器 得 到 ,典型 情况 下 计数 器 就 是 一 个 寄存 器 ) 等 ， 部 要 以 抽象 的 
方式 存在 “一 张 纸 上 ”并 被 置 丁 一 个 堆 (pile) 的 顶部 。 然 后 控制 转移 到 新 函数 ， VE eR AC EI h 
用 它 的 一 些 值 代替 这 些 寄存 器 。 如 果 它 又 进行 其 他 的 函数 调用 , 那么 它 了 世 遵 循 相间 的 过 程 。 
当 该 函数 要 返回 时 ， 它 查看 堆 (pile} 顶 部 的 那 张 “ 纸 "并 复 震 所 有 的 寄存 器 。 然 后 它 进行 勾 加 
转移 ， 

BR, 所 有 全 部 工作 均 可 由 一 个 栈 来 完成 , 而 这 正 是 在 实现 递归 的 每 一 种 程序 设计 语言 
中 实际 发 生 的 事实 。 所 存储 的 信息 或 称 为 活动 记录 (activation record), Fe ni ALB Bi (stack 
frame)。 在 典型 情况 下 ,需要 做 些微 调整 : 当前 环境 是 由 栈 顶 描述 的 。 因此 , 一 条 返 轩 知名 
就 可 给 出 前 面 的 环境 (不 用 复制 )。 在 实际 计算 机 中 的 栈 常 常 是 从 内 存 分 区 的 高 端 向 下 增长 ， 
而 在 许多 的 系统 中 是 不 检测 汶 出 的 。 由 于 有 太 多 的 同时 在 运行 着 的 函数 ， 用 尽 栈 空间 的 情 六 
总 是 可 能 发 牛 的 。 显 而 易 见 ， 用 尽 栈 空间 常 是 致命 的 错误 。 

在 不 进行 栈 溢出 检测 的 语言 和 系统 中 ,程序 将 会 贿 渡 而 没有 明显 的 说 明 。 在 这 些 系统 
中 ， 当 你 的 栈 太 太 时 会 发 生 一 些 奇 怪 的 事情 ， 因为 它 可 能 触及 到 你 的 程序 部 分 。 这 部 分 也 许 
是 主 程序 ,也许 是 数据 部 分 , 特别 是 当 你 有 大 的 数组 的 时 候 。 如 果 它 撞 进 你 的 程序 , 那么 程 
REA BER 产生 一 些 无 意义 的 指令 并 在 这 些 指令 被 执行 时 程序 月 演 。 如 果 栈 撞 进 你 的 
数据 ,很 可 能 发 生 的 是 ; 当 你 将 一 些 信息 写 人 你 的 数据 时 ， 这 些 信 息 将 冲 毁 栈 的 信息 一 一 很 
可 能 吡 返回 地 址 一 一 那么 你 的 程序 将 返 回 到 革 个 奇怪 的 地址 上 去 , 从 而 程序 期 误 。 
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da E TEC P Ago YER HB re es RE. AE RET DOSES Ae HIC TEE E CS ETT) 8j 
Hish. SFH, 某 些 完全 合法 并 且 表 商 上 无 再 的 程序 也 可 以 使 你 越 出 栈 空间 。 岗 3-54 
中 的 例 程 打印 eR. TELF AR EE. 实际 上 是 正确 的 。 它 下 背地 处 型 空 表 的 基准 情 
Hi. jf Eg HE qup. WE Re RI, GEA ER, MRK PERE A 
20 000P TCHR, WAARA 3 Tee SIA 20 000 个 活动 记录 的 -个 栈 ， 骨 型 的 情况 是 这 
些 活动 记录 出 于 它们 包含 全 部 信息 商 特 别 谋 大 , 内 此 这 个 程 订 很 可 能 归 越 出 栈 空 间 。《【 如 时 
20 000 个 元 素 还 不 足以 使 程序 前 省 ， 壕 么 可 用 更 大 的 个 数 代替 它 .，) 





/* Bad use of recursion: Printing a linked list */ 
/* No header */ 


vold 
PrintListé List L ? 
i 


| 
Jt l*/ iff L l= NULL 2 


| ft Dey PrintElement( L->Element 3; 
0 4*5 Bef PrintListi L-»Next); 


| m 


图 3-51 ”递归 的 不 当 使 用 : 打印 一 个 链表 


PERERIKA (tail recursion). 是 合用 极端 不 当前 例子 、 员 递归 涉及 在 最 后 一 : 行 
的 递归 调用 。 尾 递归 可 以 通过 将 递归 调用 变 成 goto 语句 并 在 其 前 如 上 对 两 数 每 个 参数 的 赋 
值 语句 而 手工 消除 。 它 模拟 了 递归 调用 , 因为 没有 什么 需要 存储 ; 在 递归 调用 结束 之 后 . 实 
际 上 没有 必要 知道 存储 的 值 。 因此, 我 们 就 可 以 带 着 在 一 次 递归 调 几 中 已 经 用 过 的 那些 作 go 
to 到 函数 的 顶部 。 图 3-55 中 的 程序 显示 网 3-54 的 改进 后 的 程序 。 记 住 , 你 应 该 使 用 更 日 然 
的 while 循环 结构 。 此 处 使 用 goto 是 为 说 明 编 译 器 如 何 请 动 地 去 队 着 归 。 





/* Printing a linked list non-recursively */ 
/* Uses a mechanical translation */ 
/* Mo header */ 


vo d 
PrintLtisti List L > 


1 
| tà 
i 


Printklement( L-»Element 3; 
L = L--Next: 


goto top; 
j | 


13-55 不 用 递归 打印 - -个 表 ; SPR RT SCR AE RAE 22:80 


尾 递 归 的 去 除 是 如 此 地 简单 ,以 八 某 些 编译 器 能 够 自动 地 完成 。 但 是 即使 如 此 ， 最 好 还 
是 你 的 程序 自己 去 除 它 。 

递归 总 能 够 被 彻底 除去 (编译 器 证 在 转变 成 汇编 语言 时 完成 的 ), 但 是 这 么 做 是 相当 元 长 
TR. - 般 方 法 是 要 求 使 用 一 个 栈 ， 而且 仅 当 你 能 够 把 最 低 限 度 的 最 小 值 放 到 栈 .上 时 ， 这 
个 方法 才 值 得 -用 。 我 们 将 不 对 此 做 进一步 的 详细 讨论 ， 只 是 指出 , 虽然 非 递归 程序 一 般 说 


n: 

ifé L != NULL 2 | 
i 
| 


58 $33 


来 确实 比 等 价 的 递归 程序 要 快 , 但 是 速度 优势 的 代价 却 是 由 于 去 除 递归 而 使 得 程序 清晰 性 变 
得 不 足 。 


3.4 队列 ADT 


像 栈 一 样 ， OF) (queue RAE. SRT, 使 用 队列 时 插入 在 一 端 进行 而 删除 则 在 另 一 问 进 
行 。 
3.4.1 队列 模型 

队列 的 基本 操作 是 Enqueue( ABA), TRE fESe HR p C] LEA EE (rear) ELA — T ZUR , 还 
有 Dequeue (H3 BA) , ACRI EE CR [8 ERRIA CO BAK (front) AC. PA 3-56 显示 一 
个 队列 的 抽象 模型 。 






. Dequeue (Q) Enqueue (Q ,X) 


图 3.56 队列 模型 


3.4.2 队列 的 数组 实现 

期 同 栈 的 情形 一 样 , 对 于 队列 而 言 任何 表 的 实现 都 是 合法 的 。 像 栈 一 样 ， 对 于 每 一 种 操 
(t, 链表 实现 和 数组 实现 都 给 出 快速 的 O(1) 运 行 时 间 。 队 列 的 链表 实现 是 直接 的 ， 留 作 练 
习 。 现 在 我 们 讨论 队列 的 数组 实现 。 

对 于 每 一 个 队列 数据 结构 , 我 们 保留 一 个 数组 Queue[ | 以 及 位 置 Front Al Rear, 它们 代 
表 队 列 的 两 端 。 我 们 还 要 记录 实际 存在 于 队列 中 的 元 素 的 个 数 Sizes 所 有 这 些 信息 是 作为 
个 结构 的 一 部 分 , 除 队 殉 例 程 本 身 外 通常 不 会 有 例 程 直 接 访问 它们 。 下 图 表示 处 于 某 个 中 
间 状 态 的 一 个 队列 。 顺 便 指出 ， 图 中 那些 空白 单元 是 有 着 不 确定 的 值 的 。 特 别 地 , 前 三 个 单 
元 含有 曾经 属于 该 队列 的 元 素 。 
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Front 





Rear 





操作 应 该 是 清楚 的 。 为 使 一 个 元 素 X AB, 我 们 让 Size 和 Rear 增 1, 然后 置 Queue 
[Rear] = 对 。 若 使 一 个 元 素 出 队 , 我 们 置 返 回 值 为 Queue! Front |, Size M 1, 然后 使 Front 
nbi. 也 可 能 有 其 他 的 策略 (将 在 后 面 讨论 )。 现在 论述 错误 的 检测 。 

这 种 实现 存在 一 个 潜在 的 问题 。 经 过 10 次 人 队 后 队列 似乎 是 满 了 ,因为 Rear 现在 是 
10, 而 下 一 次 再 人 队 就 会 是 一 个 不 存在 的 位 置 。 然 而 ， 队列 中 也 许 只 存在 几 个 元 素 , AAA 
干 元 素 可 能 已 经 出 队 了 。 像 栈 一 样 ， 即使 在 有 许多 操作 的 情况 下 队列 也 常常 不 是 很 大 。 

简单 的 解决 方法 是 , 只 要 Front Bt Rear 到 达 数 组 的 尾 端 ， 它 就 又 绕 回 到 开头 。 下 图 显示 
在 某 些 操作 期 间 的 队列 情况 。 这 叫做 循环 数组 (cireular array) 实 现 。 

实现 回 绕 所 需要 的 附加 代码 是 极 小 的 (虽然 它 可 能 使 得 运行 时 间 加 倍 )。 如 果 Front 或 
Rear JE 1 使 得 超越 了 数组 , 那么 其 值 就 要 重 置 为 数组 的 第 一 个 位 置 。 
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T RR TAGS 


MEME 


| rt Rear | 


— Enqueue | ] m 








1 | 4 
| Rear E Front | 
经 过 Enqueue(3)hi 
BpID ifr) 


R Front | 一 一 一 
LL | | 80 





经 过 Dequeue 并 返回 2 后 








I M 
经 过 Dequeue J]3R [Bl 1 IA 


TT BIS 


i “ 1 
Kear 
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关于 队列 的 循环 实现 , 有 两 件 事情 要 警 起 。 第 一 , 检测 队列 是 舍 为 裤 是 很 重要 的 ,办 为 
当 队 列 为 空 时 一 次 Dequeue 操作 将 不 知 不 觉 地 返回 一 个 不 确定 的 值 。 第 二, AER Bor A 
员 使 用 不 同 的 方法 来 表示 队列 的 队 头 和 队 尾 。 例 如 ,， 有些 人 并 不 用 一 个 单元 来 表示 队列 的 大 
小 , 因为 他 们 依靠 的 是 基 淮 : WP. 即 当 队列 为 空 时 Rear = Front — 1。 队 列 的 大 小 十 通过 比 
较 Rear 和 Front 隐 式 算出 的 . ise -种 非常 隐秘 的 方法 ,因为 存在 某 些 特殊 的 情形 , 因此 ， 
如 果 你 需要 修改 用 这 种 方式 编写 的 代 公 , BARRERA. RAIA ADR A 
一 -部 分 , 那么 车 数组 的 大 小 为 ASize ， 则 当 存 在 Du - 工 个 无 素 时 队列 就 满 了 ,因为 只 有 有 
ASize 个 不 同 的 大 小 值 可 被 区 分 , Tm 0 是 其 中 的 一 个 。 采 用 任意 -种 你 喜欢 的 风格 , fH SER 
保 你 的 所 有 例 程 都 是 - 致 的 。 ha 因此 如 果 你 不 使 用 表示 大 小 的 域 ， 
那 就 很 可 能 有 必要 进行 一 些 讨 论 ， 否 则 会 在 一 个 程序 中 使 用 两 种 选择 。 M, 

在 保证 Engueue 的 次 数 不 会 大 于 队列 的 大 小 的 应 用 中 , (EFI SEAR ASR f& TX — 
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Fe, 除非 主 调 例 程 肯 定 队 列 非 空 ， 奉 则 Degueue 很 少 执行 。 因 此 对 这 入 操作 ， 只 要 不 是 关键 
的 代码 ， 错 误 的 调用 常常 被 路 过 。 一 般 说 来 这 并 不 是 无 可 非议 的 ,内 为 你 可 能 得 到 的 时 间 节 
省 量 是 极 小 的 。 

我 们 通过 编写 某 些 队列 的 例 程 来 结束 本 节 , 其 余 例 程 留 作 练习 。 肯 先 , 在 图 3-57 中 给 出 
队列 的 声明 。 正 如 对 于 栈 的 数组 实现 所 做 的 那样 ,我 们 添加 一 个 最 大 大 小 的 域 。 还 需要 提供 
GFE CreateQueue 和 DisposeQueue。 此 外 ， 我 们 壕 要 提供 测试 一 个 队列 是 否 为 空 的 例 程 以 及 
构造 一 个 空 队 列 的 例 程 (图 3-58 和 图 3-59)。 读 者 可 以 编写 图 数 ISFull , 它 完 成 其 名 字 所 指出 
的 功能 。 注 意 ，Rear 在 Front 之 前 预 初始 化 为 [1。 我 们 将 要 编写 的 最 后 的 操作 是 Enqueue 8 
积 、 严 格 遵 循 上 面 的 描述 ,我 们 在 图 3-60 得 到 队列 的 数组 实现 。 


ifndef Queue h 
struct QueueRecard; 
typedef struct QueueRecord “Queue; 


int IsEmpty( Queue Q ); 

int IsFull( Queue à 3; 

Queue CreateQueue( int MaxElements 5; 
void DispaseQueue( Queue Q 2; 

void MakeEmpty( Queue Q 9; 

void £naueue( ElementType X, Queue Q ); 
ElementType Fronti Queue Q >; 

void Dequeue( Queue Q ); 

ElemaentType FrontAndDequeuet Queue Q ); 
















#endif /* Queue h */ 


/* Place in implementation file */ 
/* Queue implementation is a dynamically allacated array */ 
define MinQueueSize ( 5 ) 


struct QueueRecord 
1 . 
int Capacity: 
int Front; 
int Rear; 
int Size: 
ElementType *Array; 


图 3-57 队列 的 类 型 声明 


int 
TsEmpty{ Queue Q } 
{ 


return Q-»5ize == 0; 





图 3-58 ”测试 队列 是 否 为 空 的 例 程 一 一 数组 实现 


void 
MakeEmpty( Queue Q > 
{ 


Qq-»5ize = Ü; 
Q-»Front = 1; 
Q-»Rear = 0; 


] 





图 3-59 构造 空 队 全 的 例 程 一 一 数组 实现 
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Succé ant Value, Queue Q 3 


| ifc 


++Value == Q-»Lapacity } 
Value - D; 


| return Value; 
1 


void 
Enqueuet 


afe 


else 
; 


ElementType X, Queue Q } 
isFullé GQ? 3 


Error( "Full queue" J; 


Q--517284—; 
Qü--Rear = Suce( Q->Rear, Q 3: 
Q-»Array[ Q-»Rear ] = X; 


| 
| 
| 
| 
— | 





图 3.60 ”入 内 的 例 程 一 一 数组 实现 


3.43 队列 的 应 用 


有 几 种 全 用 队列 给 出 提高 运行 效率 的 算法 。 它 们 当中 有 些 可 以 在 图 论 中 找到 , 我 们 将 在 


第 9 章 讨 论 它 们 。 这 里 ， 先 给 出 某 些 
当 作 业 送 交 给 一 台 行 式 打 印 机 


mi HABA EBA 
, CMRR A SUI PEK. Bm. 被 送 往 行 式 


Tp ETBLAS PEE BEAR be I Bl 个 队列 di s 


Esa HRB PALE cO SU BS e 3 53 


另 一 个 例子 是 关于 计算 机 网 络 的 。 有 许多 种 PC PLI POS ERE, 其 中 磁盘 是 放 人 在 一 合 本 
做 六 件 服务 器 的 机 器 上 的 。 使 用 其 他 计算 宙 的 用 户 是 按照 先 到 先 使 用 的 原则 访问 文件 的 ,内 


Ih BOE AE TBA 


OA ASTER RIS ARIF BUSH. 对 大 公司 的 传呼 ARE AAE . 

。 在 大 规模 的 大 学 里 , 如 虹 所 有 的 终端 都 被 占用 ,由 于 资源 有 限 , 学 生 们 必须 在 一 
Sk LAE. 在 终端 上 呆 得 时 间 最 长 的 学 生 将 首先 被 强制 离开 , 而 等 待 时 间 最 长 的 
学 生 则 将 是 下 … 个 被 允许 使 用 终端 的 用 户 、 

椒 理 用 概率 的 广 法 计算 用 户 排队 预计 等 待 时 间 、 等 待 服务 的 队列 能 够 排 多 长 , 以 及 其 他 

:此 诸如 此 类 的 问题 将 用 到 被 称 为 排队 论 4queucing theory ) 的 整个 数学 分 支 - ol BA SKK 
赖 寺 - 用 户 加 入 队列 的 频率 以 及 -- 旦 上 用户 得 到 服务 时 处 理 服 务 花 费 的 上 时间: 这 两 个 参数 作为 巾 
率 分 布 函 数 给 出 。 在 一 些 简单 的 情况 下 , 答案 可 以 解析 算出 - fay AY A RH ER 


有 — BEZEL. GSR RRER DATE, TEE 


fx) uv BA BEB SR 88 AP GRIE RE RU SS 


大 限度 有 关 )。 这 个 问题 在 商业 上 很 重要 ， AAR, Af ARE Lil. 


WERE TERK, 那么 这 个 问题 解决 起 来 要 困难 得 多 。 解析 求解 出 难 的 问题 往 件 
BERI -个 队列 来 进行 模拟 。 如 果 必 很 大 , 那么 我 们 过 


使 用 模拟 的 方法 求解 。 此 时， 我 们 需 


-我们 说 基本 上 是 因为 必 亚 可 以 祝 除 去 .这 


等 于 从 队列 的 中 和 进行 的 一 次 删除 , 它 违 把 了 忠烈 的 关 销 证 艾 
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需要 其 他 一 些 数 据 结 构 来 使 得 模拟 里 有 效 地 进行 。 在 第 6 章 将 会 看 到 模拟 是 如 何 进行 的 。 那 
时 我 们 将 对 * 的 若干 秆 进行 模拟 并 选择 能 够 给 出 合理 等 待 时 间 的 最 小 的 &。 

正如 栈 一 样 ,队列 还 有 其 他 丰富 的 用 途 , 这 样 一 种 简单 的 数据 结构 竞 然 能 够 如 此 重要 ， 
LS AM T, 
Be 


本 章 描述 了 一 些 ADT HRAS, HEAHEA ae BH (ADT) BGR FT 
概念 。 主 要 目的 就 是 将 抽象 数据 类 型 的 具体 实现 与 它们 的 功能 分 开 。 程 序 必须 知道 操作 都 做 
些 什 么 , 但 是 如 果 不 知 道 如 何 去 做 实际 上 更 好 。 

表 、 栈 和 队 州 或许 在 全 部 订 [ 算 机 科学 中 是 三 个 基本 的 数据 结构 , 大 量 的 例子 证 明了 它们 
广泛 的 用 途 。 特 别 地 , 我 们 看 到 栈 是 如 何 用 来 记录 过 程 和 函数 调用 的 ， 以 及 递归 实际 上 荐 如 
何 实现 的 。 理 解 这 些 过 程 是 非常 重要 的 , 其 原因 不 只 因为 它 使 得 过 程 语言 成 为 可 能 ,而 且 还 
因为 知道 递归 的 实现 从 而 消除 了 围绕 其 使 用 的 大 量 谜团 。 虽 然 递归 非常 强大 , EEFDE 
完全 随意 的 操作 ; 递归 的 误 用 和 乱用 可 能 导致 程序 崩溃 。 


练习 


3.1 编写 打印 出 一 个 单 链表 的 所 有 元 素 的 程序 。 

3.2 ”给 你 一 个 链表 上 和 另 一 个 链表 卫 , 它们 包含 以 升序 排列 的 整数 。 操 作 PrintLots( L, P) 
将 打印 L 中 那些 由 P 所 指定 的 位 置 上 的 元 素 。 例 如 , WR p = 1, 3, 4, 6, 那么 ,二 中 
的 第 1、 第 3. 第 4 和 第 6 个 元 袁 镍 打印 出 来 。 窜 出 过 程 PrintLots( 工 ，P}。 你 应 该 只 使 
用 基本 的 表 操 作 。 该 过 程 的 运行 时 间 是 多 少 ” 

3.3 通过 只 调整 指针 (而 不 是 数据 ) 来 交换 两 个 相 邻 的 元 素 , 使 用 
a. 单 链表 。 
b. 双 链 表 。 

3.4 给 定 两 个 已 排序 的 表 L, TR Lo, APPA RARER BIS LN La 的 过 程 。 

3.5 给 定 两 个 已 排序 的 表 工 ; 和 工 ;， 只 使 用 基本 的 表 操 作 编写 计算 LAU La 的 过 和 在。 

36 编写 将 两 个 多 项 式 相 加 的 函数 。 不 要 虎 坏 输 人 数据 。 用 一 个 链表 实现 。 如 果 这 两 个 多 
项 式 分 别 有 M 项 和 项 , 那么 你 的 程序 的 时 间 复 杂 度 是 多 少 ? 

3.7 编写 一 个 函数 将 两 个 多 项 式 相 乘 ， 用 一 个 链表 实现 。 你 必须 保证 输出 的 多 项 式 按 寡 次 
排列 并 皇 最 多 有 一 项 为 任意 舌 。 
a. 给 出 以 OOM2N?) 时 间 求 解 该 问题 的 算法 。 

eb. 编写 一 个 以 OCM2N) 时 间 执行 乘法 的 程序 ， 其 中 M 是 具有 较 少 项 数 的 多 项 式 的 
项 数 。 
x C， 编写 一 个 以 DLUMN log (MN DAHAT REH EF o 

d. 上 面 哪个 的 时 间 界 最 好 ? 

3 8 编写 一 个 程序 , 输入 一 个 多 项 式 F(X), WAHE. REFN EERE 
多 少 ?至 少 再 提出 一 种 对 FOOR P 的 某 些 可 能 的 选择 具有 竞争 性 的 解法 。 

19 编写 任意 精度 整数 运算 包 。 要 使 用 类 似 于 多 项 式 运算 的 方法 。 计 算 在 2400 内 数字 0 到 
9 的 分 布 。 
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3.10 Josephus 问题 是 下 面 的 游戏 : N 个 人 从 1 BIN 465. 围 坐 成 一个 国 圈 ， 信 1 STRASSE 
递 一 个 热土 下 -经 讨 M 次 传递 后 拿 着 热土 豆 的 人 人 被 清除 亢 座 , GSS OR, H 
坐 在 被 清除 的 人 后 面 的 人 拿 起 热土 豆 继 续 进 行 游戏 ”最 后 剩 下 的 人 取胜 。 因 此 ， 如果 
M — 0 fü N = 5, WRK, 5 号 获胜 . WEM = 0) HEN = 5, 那么 被 清除 
的 人 的 顺序 是 2, 4, 1, 5. 
a. 编写 一 个 程序 解决 M ALN 在 一 般 值 下 的 Josephus 问题 ,应 使 你 的 程序 尽 可 能 地 高 
效 ,要 确保 能 够 清除 单元 。 
b. (RAAB ie THY ie] ee be 
c. 如 果 M = 1, 你 的 程序 的 运行 时 间 是 多 少 ? 对 于 大 的 NON 2 10 000). 其 free 例 
程 是 如 何 影响 实际 速度 的 ? 
.11 编写 查找 :一 个 单 链表 特定 元 素 的 程序 。 分 别 用 递归 各 韭 递 册 方 法 实现 , 并 比较 它们 的 
运行 时 间 。 链 表 必 须 达 到 多 大 才能 使 得 使 用 递归 的 程序 册 尝 ? 
3.12 a. 编写 一 个 非 递归 过 程 以 O (NOB BLUE IgE 
b, 使 用 常数 附加 空间 编写 一 个 过 程 以 O(N) 时间 反 转 单 链 胡 。 
13 ”利用 社会 安全 续 公 对 学 生 记 菏 构 成 的 数组 排序 。 编 写 一 个 程序 进行 这 件 工作 , 使 内 内 
4j 1000 RSE HEE or = BATT. 


T 


T 


3.14 ”编写 一 个 程序 将 一 个 图 读 人 邻接 表 . 使 用 
a. 链表 
b. 游标 


3.15 a. 写 出 自 调整 (self-adjusting) 表 的 数组 实现 。 自 调整 表 如 同 -- 个 规则 的 表 , 但 让 所 有 
的 插入 部 在 表 头 进行 ， 当 一 个 元 素 被 Find 访问 时 , ERC EER RA MIF AR Se 
余 的 项 的 相对 顺序 . 
- b. 写 出 自 调整 表 的 链表 实现 。 
sc. 设 每 个 元 素 都 有 其 被 访问 的 固定 概率 po 证 明 那 些 具 有 最 高 访问 概率 的 元 素 部 天 
ERR. 
16 ”假设 我 们 有 -- 个 基于 数组 的 表 A “0..N 一 11. 并 且 我 们 想 要 删除 所 有 相同 的 多 系 . 


Cl 


LastPosition 初始 值 为 N — 1, 但 该 值 随 着 相同 元 素 被 删除 而 变 得 越 米 越 小 考虑 图 |86. 


3.61 中 的 伪 码 程序 段 。 过 程 Delete 删除 位 置 } 上 的 元 素 并 使 表 破 坏 ; 





/* M for( i =; d < LastPosition; i++} 


fr 2*6 j= i+ 1; 
y* 3 whilef j < LastPosition ) 
fe 4f if¢ AL i ] == ALG 1 2 


else 


f* Be itt: 
} 


P el 


ft i Delete( 13; 


图 3-61 从 表 中 有 删除 重 元 素 的 例 程 一 iG 


a. 解释 该 过 程 是 如 何 进行 工作 的 。 
b. 利用 一 般 的 表 操 作 恒 号 这 个 过 税 。 
:¢， 如 用 标准 的 数组 实现 , 则 这 个 过 程 的 运行 时 间 是 多 少 ? 


| 88 | 
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d. 使 用 链表 实现 的 运行 时 间 是 多 少 ? 
*e. 给 出 一 个 算法 以 OCGN log N AY Bi fg te in , 
xe f. TES: 如 果 只 使 用 比较 , 那么 解决 该 问题 的 任何 算法 部 需要 ON. logN) 次 比较 ， 
(提示 : W 7 9x.) 
*g. WEB]: 如 果 我 们 允许 除 比 较 之 外 的 其 他 操作 ,并且 这 些 关 键 学 部 是 实数 ， 那 么 我 们 ] 
不 用 元 素 间 的 比较 就 可 以 解决 该 问题 。 
3.17 不 同 于 我 们 己 经 结 出 的 删除 方法, 另 —REBUBETRIER Cozy deletion ) 的 方法 ,为 了 
删除 一 个 元 素 , 我 们 只 标记 上 该 元 素 被 删除 ! 使 用 一 个 附加 的 位 (bit) 域 )。 表 中 被 删 阶 
和 非 被 删除 元 素 的 个 数 作为 数据 结构 的 一 部 分 被 保留 。 如 末 被 删除 元 素 和 非 被 删除 抱 
素 一 样 多 , 我 们 追 历 束 个 表 , 对 所 有 被 标记 的 节点 执行 标准 的 删除 算法 ， 
a. 列 出 懒惰 删除 的 优点 和 缺点 。 
b. 编写 实现 使 用 懒惰 删除 的 标准 链表 操作 的 例 程 。 
3.18 用 下 列 语言 编写 检测 平衡 符号 的 程序 : 
a. Pascal (begin Zend , C). | jh ti) 
b.C(e* *^,O€Q, D]. ib) 
x Cc, 解释 如 何 打印 出 错 信 息 、 
3.19 编写 一 个 程序 计算 后 缀 表达 式 的 值 。 
3.20 a. 编写 一 个 程序 将 中 绥 圾 达 式 转换 成 后 缀 表达 式 ,， APR RIAM TNC ，+ ， 
"UU K PRR o 
b. JERESAETHISUSVARBUTE S RAPE: 
c. EMER GRAY AREA SL 
121 RET BL SA RR, BREA 8E— T REC DERE, 否则 你 的 
Tte FEAR BER Qi HA FS HR. 
3.22 «a. 提出 支持 栈 的 Push 和 Pop 操作 以 及 第 二 种 操作 FindMin 的 数据 结构 , 其 中 FindMin 
返回 该 数据 结构 的 最 小 元 素 ,， 所 有 操作 在 最 坏 的 情况 下 的 运行 时 间 都 是 OCL. 
xb. 证明， 如 果 我 们 吉 和 第 四 种 操作 DetereMin， 那 么 至 少 有 一 种 操作 必须 化 费 
(ogN) 时 间 , FE, DeleteMin 找 出 并 删除 最 小 的 元 素 。( 本 题 需要 阅读 第 7 36) 
*3.23 说 明 如 何 用 一 个 数组 实现 三 个 楼 : 
3.24 在 2.4 节 中 用 于 计算 翡 波 那 契 数 的 递归 例 程 如 果 在 N = 5 下 和 运行， 栈 空 间 有 本 能 用 
完 妈 ?为 什么 ? 
3.25 ”编写 实现 队列 的 例 程 , 使 用 
a. 链表 
b. 数组 


3.26 XU BAFI (deque) t B — HE 的 表 组 成 的 数据 结构 ， 对 该 数据 结构 可 VAUuttI T ARE : 


Push(X, D): 将 项 六 插入 到 双 端 队列 DD BIRDA o 
Pop(D): MS BA 9j D FP aM ER: Bu 3650274 FEF Ha [E] 
Inject (X, D): 将 项 X fé A SIL BAS D B EE H o 
ject (D) ; BoDORSEA Y] D 中 月 除 尾 端 硕 并 将 其 返回 。 
编写 支持 双 端 队列 的 例 程 , 每 种 操作 均 花 费 O(1) 时 间 。 
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对 于 大 虽 的 输入 数据 , 链表 的 线性 访问 时 间 太 慢 ， 不 宜 使 用 ， 本 章 我 们 介绍 一 种 简单 的 
数据 结构 ,其 大 部 分 操作 的 运行 时 间 平 均 为 Oog N)。 我 们 还 鉴 简 述 对 这 和 促 数据 结构 在 概 
念 上 的 简单 的 修改 , 它 保 证 了 在 最 坏 情形 下 的 上 述 时 间 界 。 此 外 . 还 讨论 了 第 种 修改 ,对 
于 长 的 指令 序列 它 对 每 种 操作 的 运行 时 间 基本 上 是 O(log N): 

茂 们 涉及 到 的 这 种 数据 结构 叫做 二 丸 查 找 树 {binary search treej。 在 计算 机 科 尝 中 树 


"了解 峙 是 如 何 用 于 实现 几 个 流行 的 操作 系统 中 的 文件 系统 的 。 

"” 夏 到 树 如 何 能 够 用 来 计算 算术 衣 达 式 的 值 . 

。 指出 如 何 利用 树 交 持 以 O(NogN) 平 均 时 间 进 行 的 各 种 搜索 操作 ,以 及 如 何 细 化 以 得 到 
最 坏 情 况 时 间 禾 OClog NO, 我 们 还 将 讨论 当 数 据 被 存 齐 碟 盘 上 时 划 休 来 实现 这 些 操 作 


4.1 预备 知识 


宰 {trce) 吕 以 用 上 儿 种 方式 定义 。 定义 树 的 -种 自然 的 方式 是 递归 的 方法 。 一 避 树 是 一 些 
节点 的 集合 。 这 个 集合 可 以 是 空 集 ; 若非 空 , WERT HR Coot RTA r ARO PR 


多 个 非 空 的 (了 ) 树 T. T;..... TAR, 这 些 子 树 路 每 一 棵 的 根 者 被 来 自 根 r RA 
AJA (edge) PTE tE o 


fi TARA ABI AGR > 的 儿子 (child), 而 r AR RIBUS X paren. [E 4-1 
显示 用 递归 定义 的 典型 的 树 ; 


rol 





iE 411. 一 般 的 树 


从 递归 定义 中 我 们 发 现 , 一 棵 树 是 N 个 节点 和 AN - 1 条 边 的 集合 ,其 中 的 一 个 节点 是 
做 根 ， 存 在 N - 1 条 边 的 结论 是 由 下 面 的 事实 得 出 的 , 得 条 边 帮 将 某 个 节点 连接 到 尼 的 信 
X. SR n RESI BA — TP SCR CILE 4-2). 


图 4-2 —TPRELDEBSRI 





一 一 -一 一 -一 -一 一 一 一 一 -一 -一 -一 一 一 
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在 图 4-2 的 树 中 ,节点 ARR. 而 点 下 有 一 个 父亲 态 并 日 有 儿子 KK、L 和 和 M， 每 一 个 市 
点 可 以 有 任意 多 个 儿子 , 也 可 能 是 零 个 儿子 ,没有 上 几 了 于 的 节点 称 为 树叶 {leaf); 上 图 中 的 树叶 
是 B.C、 HV I, P、Q、K、L、M 和 N。 共 有 相同 父亲 的 节点 为 兄弟 (sibling); 因此 , K, LA 
M 部 是 兄弟 。 用 类 似 的 方法 可 以 定 光 祖父 {grandparent) 和 和 孙子 (grandchild) 关 系 。 

从 节点 n, 到 n, 的 路 径 (path] 定 义 为 节点 ni, nos sss on 的 一 个 序列 ,使 得 对 于 1 所 i< 角 ， 
节点 n 是 m4 1 的 父亲 。 这 个 路 径 的 长 (length) 为 该 路 径 上 的 边 的 条 数 , 即 有 一 1。 从 每 一 个 节点 
到 它 自己 有 一 条 长 为 0 的 路 径 。 注 意 , 在 一 棵 树 中 从 根 到 每 个 节点 恰好 存在 一 条 路 径 - 

对 任意 节点 n, on; 的 深度 (depth) 为 从 根 到 n 的 惟一 路 径 的 长 。 因 此 , 根 的 深度 为 0。 
n: 的 高 (height) 是 从 n: 到 一 片 树叶 的 最 长 路 径 的 长 。 因 此 所 有 的 树叶 的 高 都 是 0。 一 标 树 的 
高 等 于 它 的 和 根 的 高 。 对 于 图 A2 WOM, EE 的 深度 为 1 而 高 为 2; 了 的 深度 为 1 而 高 也 是 1; 
沪 树 的 高 为 3。 一 个 树 的 深度 等 于 它 的 最 深 的 树叶 的 深度 ; 该 深度 总 是 等 于 这 棵 树 的 高 。 

如 果 存 在 从 n, 到 n; 的 一 条 路 径 , 那么 ni AE on; 的 一 位 祖先 (ancestor) 而 22 是 s, 的 一 
A. & & (descendant). WM n, ono, 那么 ny 是 n Wf KAA (proper ancestor) ii n2 是 n 
Ki—“> 4.48 & (proper descendant) e 
4.1.1 树 的 实现 

实现 树 的 一 种 方法 可 以 是 在 每 一 个 节点 除数 据 外 还 要 有 一 些 指针 ,使 得 该 节点 的 每 一 个 

"go 儿子 都 有 一 个 指针 指向 它 。 然 而 ， 由 于 每 个 节点 的 儿子 数 可 以 变化 很 大 并 且 事 先 不 知道 , A 
M 此 在 数据 结构 中 建立 到 各 儿子 节点 直接 的 链接 是 不 可 行 的 ， 因为 这 样 会 产生 太 包 的 浪费 衬 

间 。 实 际 上 解法 很 简单 : 将 每 个 节点 的 所 有 儿子 都 放 在 树 节点 的 链表 中 。 图 4 3 FH RIFS BRA, 
是 典型 的 声明 。 


typedef struct TreeNode *PtrToNode; 


struct TreeNode 


EtementType Element; 

PrrToNode FirstChild; 

FtrToNode NextSibling; 
} 





图 4-3 树 的 节点 声明 


图 4 .4 显示 一 栋 树 可 以 用 这 种 实现 方法 襄 示 出 来 。 图 中 向 下 的 箭头 是 指向 FirstChild( 第 
一 所 子 ) 的 指针 。 从 左 到 右 的 箭头 是 指向 NextSibling( 下 一 兄弟 ) 的 指针 。 因 为 空 指 针 太 多 ， 
所 以 没有 把 它们 画 出 。 





图 44 在 图 4 2 中 所 表示 的 树 的 第 一 儿子 /下 “兄弟 的 表示 法 
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CO 





GC 


在 图 4-4 的 树 中 , 节点 上 有 一 个 指针 指向 兄弟 {F), BRETT ULF OR. 而 有 的 节点 
这 黄种 指针 都 没有 。 
4.1.2 树 的 遍历 及 应 用 

树 有 很 多 应 用 。 流 行 的 用 法 之 一 是 包括 UNIX. VAX/VMS 和 DOS 在 内 的 许多 常用 棵 
作 系 统 中 的 目录 结构 。 图 4-5 是 UNIX 文件 系统 中 一 个 典型 的 目录 。 


"uar" 
=A T 


一 一 一 -一 


一 一 一 一 一 -一 
markt alex* bi^ 
一 ~ 
book* Colr&e* — junk e quake — work" course“ 

2 M | 
chls  chlr chads — copasao cop3212* 
——— 

eT TT 0 
falia” — sprOT* — sum97* fallas fau 


| -一 


^. 7 
ay Lt «yl.r wir gades — preg!t — progir prez2r proglar — grades 
图 4-5 UNIX Air 


KPARM BE As. 《名 字 后 面 的 星 号 指出 “Ausr A ERE EE Bose sr f — TL 
T: mark, alex 和 bi， 它们 自已 也 都 是 目录 。 因 此 ,“Asr (LE — T Hom HE ELSE 
件 。 文 件 各 "AusrAmarkAbookAchl.r" 先 后 三 次 通过 最 左边 的 儿子 节点 而 得 到 。 在 第 一 个 “A 
后 的 每 个 “A "都 表示 一 条 边 ; 缚 时 为 一 全 路 径 名 。 这 个 分 级 文件 系统 非常 流行 AW ine 
使 得 用 户 光 辑 地 组 织 数 据 。 不 仪 如 此 , 在 不 同 目 录 下 的 棒 个 文件 还 可 以 学 有 相同 的 名 字 . A 
为 它们 必然 有 从 根 开始 的 不 同 的 路 径 从 而 具有 不 同 的 路 径 名 。 存 UNIX 文件 系统 中 的 日 孙 
就 是 含有 它 的 所 有 儿子 的 -- 个 交 件 , 因此 , 这 些 日 录 几 乎 是 完全 按照 b VR B8 26 300 es BELA] E 
KE 事实 上 上 ,如果 将 打印 一 个 文件 的 标准 命令 应 用 到 一 个 日 录 . 上 , BARA CP BUR 
文件 名 能 够 在 (与 其 他 非 ASCII 信息 一 起 的 ) 输 出 中 被 看 到 。 

设 我 们 想 要 列 出 目录 中 所 有 文件 的 名 字 。 我 们 的 输出 格式 将 是 : 深度 为 d 的 文件 的 多 
字 将 被 d 次 跳 格 (tab) 缩 进 后 打印 出 来 。 该 算法 在 图 4-6 中 给 出 - 


static void 
ListDirt DirectoryOrFile D, int Depth ) 





if( D is a legitimate entry ) 


{ 
/* Ij PrintName( D, Depth 5; 
/* 3*/ ifC D is a directory > 
/* anf for each child, C, of D 
/* 5*/ Listir C, Depth — 2 3; 
} 
[ t 
| void 


ListDirectory( DirectoryOrFile D > 


ListDir( D. O }; 


} 





4.6 列 出 分 级 文件 系统 中 目录 的 例 程 





二 EUN 文件 系统 中 每 个 目录 还 有 一 项 指向 该 目录 本 身 以 及 另 SGREERHORRUAE HG. Wi, PEG iE 
UNIX X fd SR dH, EAA (ireelike). 
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算法 的 核心 为 递归 过 程 ListDir。 为 了 显示 根 时 不 进行 缩 进 , 该 例 程 需要 从 目录 名 和 和 深度 
0 开始 。 这 里 的 深度 是 一 个 内 部 敌 记 变量 , 而 不 是 主 调 例 程 能 够 期 望 知道 的 那 种 参数 。 因 
此 ， 驱动 例 程 ListDirectory 用 于 将 递归 例 程 和 奸 界 连接 起 来 。 

算法 逐 辑 简单 易 懂 。ListDir 的 参数 是 到 树 中 的 某 种 引用 。 只 要 引用 合理 , 则 引用 涉及 的 
名 字 在 进行 适当 次 数 的 跳 格 缩 进 后 被 打印 出 来 。 如 果 是 一 个 目录 , 那么 我 们 递归 地 一 个 一 个 
地 处 理 它 所 有 的 此 子 。 这 些 儿 子 处 在 一 个 深度 上 , 因此 需要 缩 进 一 段 附加 的 空格 。 整 个 输出 
在 图 4.7 中 表示 。 


course 
cop3212 
fal196 


grades 
progi.r 
prog2.r 
fall97 
prog2.r 
progl.r 
grades 





图 4-7 Eo CHOSE 


这 种 遍历 的 策略 叫做 先 序 遍历 (preorder traversal). EAFRD R, 对 节点 的 处 理工 作 是 在 
它 的 诸 儿 子 节 点 被 处 理 之 前 (pre) 进 行 的 。 当 该 程序 运行 时 , 显然 第 二 行 对 每 个 节点 恰好 执行 一 
Xx. 关 为 每 个 名 字 只 输出 一 次 。 由 于 第 2 行 对 每 个 节点 最 多 执行 一 次 , 因此 第 3 行 也 必须 对 每 
个 站 点 执行 一 次 。 不 仅 如 此 , 对 于 每 个 节点 的 每 一 个 儿子 节点 第 5 行 最 多 只 能 被 执行 一 次 。 不 
过 ,儿子 的 个 数 怡 好 比 节点 的 个 数 少 1。 最 后 , 第 5 行 每 执行 一 次 , for FEA MRK, #5 “S48 
环 结 束 时 再 加 上 一 次 。 每 个 for 循环 终止 在 NULL 指针 上 ， 但 每 个 节点 最 多 有 一 个 这 样 的 指针 。 
因此 ,每 个 节点 总 的 工作 量 是 常数 。 如 果 有 NN 个 文件 名 需要 输出 ， 则 运行 时 间 就 是 OLN ): 

另 一 种 遍历 树 的 方法 是 后 序 遍 历 (postorder traversal) 。 在 后 序 遍 历 中 , 在 一 个 节点 处 的 
工作 是 在 它 的 诸 儿 子 节点 被 计算 后 (post) 进 行 的 。 例 如 , 图 4-8 表示 的 是 与 前 面相 同 的 目录 
结构 ,其 中 图 括号 内 的 数 代表 每 个 文件 占用 的 磁盘 区 块 (disk bliock) 的 个 数 。 

由 于 目录 本 身 也 是 文件 , 因此 它们 也 有 大 小 。 设 我 们 想 要 计算 被 该 树 所 有 文件 占用 的 硫 
盘 块 的 总 数 。 最 自然 的 做 法 是 找 出 含 于 子 目 录 ” /usr/mark(30)" , " /usr/alex(9 ) #1“ Zusr/bill 
(32)" 的 块 的 个 数 。 于 基 , 磁盘 块 的 总 数 就 是 子 目录 中 的 块 的 总 数 471 ) 加 上 “musr "使 用 的 一 
个 块 , 共 了 2 个 块 。 图 4-9 中 的 图 数 SizeDirectory 实现 这 种 遍历 策略 。 













5n 69 
fusrh be 
一 一 -六 一 
mark *, l} alex. pii*t li 
一 一 一 
book *r1) course *( p? akció junk) work "( 1) caurse*r ri 
Md 7. 
chl r(3) ch? rit ch} 4). cop3530* ly capizlz* t 
- i " 一 MM 
E4195" (1 spr97"(ListimQ7* 3} failB6*i 1a TG? 1) 
| — NIMM —— qp 
splatly syl) sd 2) grades¢3) prog] rid] progZ rili prog? zt2! prag] r(7) gradesc?? 
入 4-8 eR RUSSIA A TEXAS Unix Hor 
static void 
SizeDirectary( DirectoryOrFile D ) ' 
{ 
int TotalSize; 
1 
/* 1*/ TotalSize = D; 
ft 2*/ if€ D is a legitimate entry ) 
{ i 
/* 3*/ TatalSize = FileSize( BD); 
ft 4%/ iff D is a directory } 
fF 5*f for each child, C, of D | 
/* 6*f TotalSize += SizeDirectory( C J); | 
} i 
return TotalStze; 
图 4-9 AT ERAAI | 94 | 


i DAB—T A, 那么 SizeDirectory Aik lA] D Brit BRR Bil, g D SAR 
ode D B E REPRE T TAOID CL CUR ko 9T KIEA aa SR a TRE 
略 之 问 的 不 同 , 图 4-10 显示 每 个 日 录 或 文件 的 大 小 号 如 何 由 该 算法 产生 芍 。 





chl.r 3 
ch2.cr 2 
ch3.r 4 
book 10 
Syl.r 1 
fall96 2 
syl.r 5 
spray G 
ayl.r 2 
sumo? 3 
cop3530 12 
course 13 
junk.¢ 6 
:mark 30 
\ junk.c 8 
alex 9 
work 1 
grades 3 
progi.r 4 : 
progé.r 1 ; 
failg6 9 
prog2.r 2 
progl.r 7 
grades 4 
fall97 19 | 
| cop3217 29 
course 30 
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fuse | 


E 4-10 A% SizeDirectory 的 轨迹 
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42 二 又 树 


— SUBE (binary tree) 是 一 梯 树 , 其 中 每 个 节点 部 不 能 有 多 于 丙 个 的 儿子 。 
图 4-11 显示 一 棵 由 一 个 根 和 两 棵 子 树 组 成 的 二 多 树 ， 厂 和 和 Tr 均 可 能 为 空 


J 


图 4-11 —fÉ XH 


二 义 树 的 一 个 性 质量 平均 二 丸 树 的 深度 这 比 N 小 得 多 ， 
这 个 性 质 有 时 很 重要 。 分 析 表 明 , 这 个 平均 深度 为 OG ND, 
而 对 于 特 味 类 增 的 二 六 树 , HRS 3E d& BP (binary search tree), 
其 深度 的 平均 值 是 O(log N). THRE, EAR 4-12 中 的 
例子 所 示 , 这 个 深度 是 可 以 大 到 NN 一 1 的 。 

4.2,1 实现 

因为 -- 标 二 丸 树 最 多 有 两 个 儿子 ,所 以 我 们 可 以 用 指针 
直接 指向 它们 。 树 节点 的 声明 在 结构 上 类 似 于 双 链 表 的 声明 ， ”图 4.12 SOUL 
在 声明 中 , 一 个 节点 就 是 由 Key{ 关 键 字 ) 信 息 加 上 两 个 指向 其 他 节点 的 指针 (Left 和 Right) 
组 成 的 结构 ( 见 图 4-13)。 

应 用 于 链表 上 的 许多 法 则 也 可 以 应 用 到 树 上 。 特 别 地 ， 当 进行 一 次 插入 时 , 必须 调用 
mallo 创建 一 个 节点 。 节 点 可 以 在 调用 free 删除 后 被 释放 ， 

我 们 可 以 用 习惯 上 在 画 链 表 时 使 用 的 矩形 框 画 出 二 叉 树 ,但 是 , 树 一 般 画 成 画 圈 并 用 一 

au] SEREREK, A SUNS LACE IE (graph): APRENS, RAE ATE ALE 
NULL 指针 , 因为 具有 N 个 节点 的 每 一 标 二 叉 树 都 将 需要 N + 1 个 NULL 指针 。 





typedef struct TreeNode *PtrToNode; 
typedef struct PtrToNode Tree; 


struct TreeNode 


ElementType Element; 
Trea Left; 
Tree Right; 


H 
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二 叉 树 有 许多 与 搜索 无 关 的 重要 应 用 - 二 色 树 的 主要 用 处 之 一 是 在 编译 器 的 设计 领域 ， 
我 们 现在 就 来 探索 这 个 问题 。 
4.2.2 REAP 

图 4-14 表示 一 个 表达 式 树 (expression tree) 的 例子 。 表达 式 树 的 树 时 是 操作 数 (operand)， 


比如 常数 或 变 生 ,而 其 他 的 节点 为 操作 蔡 {operater)。 由 于 这 里 所 有 的 操作 都 旦 二 元 的 , 因此 
这 操 特 定 的 树 正 杂 是 并 丸 树 , 最 然 这 是 最 简单 的 情况 , PRD AMAA Ae PA 
儿子 的 。 一 个 节点 也 有 可 能 只 有 一 个 儿子 , 如 其 有 一 目 减 算 符 (unary minus operator) 的 情形 。 
我 们 可 以 将 通过 递归 计算 左 耻 树 和 右 于 树 所 得 刘 的 值 应 用 在 根 钼 的 算 符 操作 吊 而 算出 表 过 式 
Bragg. dea Ire. 左 子 树 的 值 是 "a + (bx o", ATRE d * e) + A tg, 
因此 整个 树 表示 "(a + (b * e) + (((d * e + D* gi. 


NOR 
oA ae 
e) © 

d e 


图 4-14 “la tb * c)ec((d * et Degn 表达 式 树 


我 们 可 以 通过 递归 产生 一 个 带 括号 的 左 表 达 式 , Aa TE ERAR eA. Ax Pp 
jaune -个 带 括 导 的 丰 表 达 式 出 得 到 一 个 {对 两 个 括号 整体 进行 运算 的 ) 中 织 表 太 式 (infix 
cxpression}。 这 种 一 般 的 方法 (在 , TA. TRA 中 序 遍 上 历 (inorder uaversal); 由 于 其 产生 的 
KERAM, DOM GABA IZ. 

另 一 个 遍历 策略 是 递 归 打 印 出 左 子 树 、 右 子 树 , RER RRM HEOURIOR 
BS RORY, 则 输出 将 是 "abc* tde itg +", Eu, EE 3.3.3 节 中 的 
后 如 表达 式 。 这 种 遍 册 策略 一 般 称 为 后 序 遍 历 (postorder traversal)。 我 们 稍 早 已 在 4.1 TA 
过 这 种 排序 策略 。 

第 三 种 遍历 策略 是 先 打印 出 运算 符 , IT EP. HR € +a 
x be + * defo” SARA HERI 8] 58 (prefix I 这 种 遍历 策 咯 为 先 序 遍 历 (preorder traver- 
aD, 稍 早 我 们 也 在 4.1 节 见 过 它 。 以 后 , 我 们 还 要 在 本 章 讨论 这 些 遍 历 策略 。 
构造 一 棵 表达 式 树 

我 们 现在 给 出 一 种 算法 来 把 后 缀 表达 式 转变 成 表达 式 树 . 由 于 我 们 已 经 有 了 将 中 缀 表达 
忒 续 变 成 后 绷 表 达 式 的 算法 ,因此 我 们 能 够 从 这 两 种 常用 类 型 的 输入 生成 表达 式 树 。 所 描述 
的 方法 酷似 3.2.3 FAS RRA. 我 们 一 次 -个 符号 地 读 人 表达 式 。 如 果 符 号 是 操作 
数 ， 那么 我 们 就 建立 .个 单 节点 树 并 将 一 个 指向 它 的 指针 推 入 伐 中 ， 如 果 符 号 是 操作 符 ， 财 
么 我 们 就 从 栈 中 弹出 指向 项 标 衬 Ti 和 T BAB AP RET CT, 的 先 弹 出 ) 并 撒 成 ~… 棵 新 的 树 ， 
Bus tr SERT. 它 的 左 . LE RUIT, 和 Ti Ak I EHI po] oc GCSE BS EE BA 
栈 中 。 

来 看 一 个 例子 。 设 答 和 人为: 

abt cedet * * 


前 两 个 符 导 是 操作 数 ,因此 我 们 创建 两 棵 单 节点 树 并 将 指向 它们 的 指针 压 人 栈 中 。 


Oe eae, FEATS LER PSC AS Tat IS 
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RAF 


5 接着 ,“+ "被 恋人 ,因此 指向 这 两 棵 树 的 指针 被 弹出 , Ra AT CL, vua S] EON SET 


|) 被 压 人 栈 中 。 
98 





| 99] 继续 进行 , VRAT * ”号 , 因此 , 我 们 弹出 两 个 树 指 针 并 形成 一 个 新 的 树 ,，“* “号 是 
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的 根 。 
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4.3 查找 树 ADT 一 -一 二 又 查找 树 


二 叉 树 的 - .个 重要 的 应 用 是 它们 在 查找 中 的 合用。 假设 树 中 的 每 个 节点 被 指定 一 个 关键 
学 值 。 存 我 们 的 例子 中 , 虽然 任意 复杂 的 关键 字 都 是 允许 的 , 但 为 简单 起 见 , 假设 它们 部 是 
整数 ， 我 们 还 将 假设 , 所 有 的 关键 字 是 互 异 的 , 以 后 再 处 理 有 重复 的 情况 。 

使 二 又 树 成 为 二 灸 查找 树 的 性 质 是 , 对 于 树 中 的 每 个 节点 X. 它 的 左 子 树 中 所 有 关键 字 
ftp Fx 的 关键 字 值 , 而 它 的 右 子 树 中 所 有 关键 字 值 大 于 X 的 关键 宁 值 。 注 意 , KERE, 
该 衬 所 有 的 元 素 可 以 用 某 种 统一 的 方式 排序 .在 图 4-15 rp, 左边 的 树 是 二 义 查 找 树 , 但 右边 
的 树 则 不 是 。 右 边 的 树 在 其 关键 字 值 是 6 的 节点 (该 节点 正好 是 根 节 点 ) 的 左 子 树 中 , 有 个 
节点 的 关键 字 值 是 7。 





图 4-15 两 棵 二 丸 树 {只 有 左边 的 树 是 查找 树 ) 


现在 给 出 道 党 对 二 叉 查 找 树 进行 的 操作 的 简要 描述 。 注 意 , 由 于 树 的 递归 定义 , 通常 大 
递归 地 编写 这 些 操作 的 例 程 。 因 为 二 又 查找 树 的 平均 深度 是 O(log ND, 所 以 我 们 一 般 不 必 
操心 栈 空 间 被 用 尽 。 存 图 4-16 中 我 们 重复 类 型 定义 并 列 出 函数 的 一 些 性 质 。 由 于 所 有 的 元 
素 都 是 有 有 序 的 , 因此 , 昔 然 对 某 些 类 型 也 许 会 出 现 语法 错误 , 但 我 们 还 中 要 假设 运算 符 <”. 
“A = "可 以 用 于 这 些 元 未。 

4.3.1 MakeEmpty 

这 个 操作 主要 用 于 初始 化 。 有 些 程序 设计 入 员 更 感 意 将 第 一 个 元 素 初始 化 为 单 节 名 树 ， 
但 是 ,我 们 的 实现 方法 更 紧密 地 遵循 树 的 递归 定义 。 正 如 图 4-17 中 显示 的 , 它 是 一 个 简单 的 
mA: 
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#ifndef Tree. H 


Struct TreeNode; 
typedef struct TreeNode *Position; 
typedef struct TreeNode *SearchTree; 


SearchTree MakeEmpty( SearchTree T 3; 

Position Finde ElementType X, SearchTree T 3: 
Position FindMin( SearchTree T ); 

Position FindMax( SearchTree T 2; 

SearchTree Insert( ElementType X, SearchTree T ); 
SearchTree Delete( ElementType X, SearchTree T }; 
ElementType Retrieve( Position P 3; 


endif /* Tree */ 


/* Place in the implementation file */ 
struct TreeMode 

{ 

ElementType Element; 

SearchTree Left: 

Searchiree Right: 


hi 


图 4-16 二 叉 查 找 树 声明 


SearchTree 
MakeEmpty( SearchTree T ) 


if( T im NULL 3 
MakeEmpty( T-»Left ): 


MakeEmpty( T-»Right 5; 
free€ T ); 


] 
return NULL; 


H 





图 4-17 建立 一 棵 空 树 的 例 程 


4.3.2 Find 

这 个 操作 一 般 需 要 返回 指向 树 T 中 具有 关键 字 X 的 节点 的 指针 ， 如 果 这 样 的 节点 不 存 
在 则 返回 NULL。 树 的 结构 使 得 这 种 操作 很 简单 。 如 有 果 了 是 NULL, 那么 我 们 可 以 就 返回 
NULL。 否则 , 如果 存 赃 在 工 中 的 关键 字 是 X, 那么 我 们 可 以 返回 T. EN, 我们 对 树 了 的 
左 子 树 或 右 子 树 进行 一 次 递归 调用 , 这 依赖 于 X 与 存储 在 T 中 的 关键 字 的 关系 。 图 4-18 中 
的 代码 就 是 对 这 种 策略 的 一 种 体现 。 

注意 测试 的 顺序 。 关 键 的 问题 是 首先 要 对 是 否 为 空 树 进行 测试 ,否则 就 可 能 在 NULL 
指针 上 呢 轿 子 。 其 余 的 测试 应 该 使 得 最 不 可 能 的 情况 安排 在 最 后 进行 。 还 要 注意 ， 这 里 的 两 
个 递归 调用 事实 上 都 是 尾 递归 并 且 可 以 用 一 次 赋值 和 一 个 goto TARAR ARE. EH 
的 使 用 在 这 里 是 合理 的 ， 因为 算法 表 近 式 的 简明 性 是 以 速度 的 距 低 为 代价 的 ， 而 这 毕 所 使 用 
的 楼 空间 的 量 也 只 不 过 是 O(log NOME. 
4.3.3 FindMin 和 FindMax | | 

这 些 例 程 分 别 返 回 树 中 最 小 元 和 最 大 元 的 位 辣 。 虽然 返回 这 些 元 素 的 准确 值 似 平 更 合 
EB, 但 是 这 将 与 Find 操作 不 相 容 。 重 要 的 是 ， 看 起 来 类 似 的 操作 做 的 工作 也 是 类 似 的 。 为 抄 
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— 
| Position 
| Find( ElementType X, SearchTree T } 
| if( T == NULL 》 
| return NULL; 
iff X < T-»Element ) 
| return Find{ X, T->Leftt 5; 
| else | 
itë X > T-»Elemant } | 
| return Find( X, T-»Ríght J; 


| 
| 
i 


A] 4-18 一 叉 查 找 树 的 Find 操作 


行 下 indiMin ， 从 根 开 始 并 且 只 要 有 左 儿 子 就 向 左 进 行 . 终止 点 是 最 小 的 正楷 ，、FindMax (4 
除 分 支 朝 向 右 几 子 外 其 余 过 程 相同 。 

这 种 递归 是 如 此 和 容易 以 至 于 许 窜 程 序 没 计 员 不 上 大 其 和 产地 使 用 它 。 我 们 用 两 种 方法 纳 写 这 
两 个 例 程 , 用 递归 编写 FindMin, 而 用 非 递 归 编 号 FindMax( IL Eg 4-19 和 图 4-20). 


Position 
FindMin€ SearchTree T ) 


if T == NULL } | 
return NULL; 


if( T-»Left == NULL ) 
return T; 


| { 
| else 
| 


else 


retura FindMin( T-»Left 3; 
} 


图 419 X[— X FAX RES] FindMin IPEA SEA 


Position 
FindMax( SearchTree T } 
í ! 


| if{ T l= NULL 3 
| while( T-»Right l= NULL ) | 
T = T->Right; 


return T; | 
1 





4 


图 4.20 ”对 二 及 查找 树 的 Find Max 的 非 递 归 实 现 


注音 我 们 是 如 何 小 心地 处 理 空 树 这 种 退化 情况 的 。 盘 然 小 心 总 是 各 坚 约 ， 但 在 北上 归程 他 
HERRERA, tih, 还 要 注意 , 在 FindMax 中 对 T 的 改变 是 安全 的 ， 因为 我 们 只 用 持 贞 来 
进行 工作 。 不 管 怎 么 说 , 还 是 应 该 随时 特别 小 心 , 因为 诸如 *T - Right = T -> Right 7 
> Right" 这 样 的 语句 将 会 产生 一 些 变化 。 

4.3.4 Insert | 

进行 插 人 操作 的 例 程 在 概念 上 是 简单 的 。 为 了 将 X BART 中 ， 称 可 以 像 用 Find if 
Boc eri, WRRA X, 则 什么 也 不 用 做 (或 做 一 些 “更 新 ")。 否 则 , REX A 
路 从 上 的 最 后 一 点 上 。 图 4-21 显示 实际 的 插入 人情 帝 。 为 了 插入 5, 我 们 遍历 该 树 就 好 像 在 运 


17 Find。 在 具有 关键 字 4 的 节点 处 ,我 们 需要 疝 右 行进 , 但 右边 不 存在 子 树 , 因此 5 不 在 这 
RRE, 从 而 这 个 位 置 就 是 所 要 揪 人 的 位 置 。 






图 4-21 在 插入 5 以 前 和 以 后 的 二 叉 查 找 树 


重复 元 的 插 人 可 以 通过 在 节点 记录 中 保留 一 个 附加 域 以 指示 发 生 的 频率 来 处 理 。 这 使 束 
个 的 树 增加 了 某 些 附加 空间 , 但 是 , 却 比 将 重复 信息 放 到 树 中 要 好 ( 它 将 使 树 的 深度 变 得 很 
JO, HR, 如 果 关 键 字 只 是 一 个 更 大 结构 的 一 部 分 , 那么 这 种 方法 行 不 通 ， 此 时 我 们 可 以 把 
只有 相同 关键 字 的 所 有 结构 保留 在 一 个 辅助 数据 结构 中 , 如 表 或 是 另 一 棵 查找 梢 中 。 

图 4.22 显示 插入 例 程 的 程序 。 由 于 T 指向 该 树 的 根 , 而 根 又 在 第 一 次 揪 人 时 变化 , PS 
此 Insert 被 写成 一 个 返 同 指向 新 树 根 的 指针 的 函数 。 第 8 行 和 第 10 行 递归 地 播 和 人 X. 到 适当 
BUT BB 


5earchIree 
Insert( Elementtype X, SearchTree T ) 
i 
/* 1*/ ift T == NULL } 
{ 
/* Create and return a one-node tree +f 
/* 2g" T = malloc( sizeaf( struct TreeNode 2 >; 
/* 3*/ iff T = NULL 3 
f/* 4A*/ FatalError( “Out of space!!!" J; 
else 
{ 
A" 5*/ T->Element = X; 
/* 6*/ T-»Left = T-»Right - NULL; 
t 
} 
else 
/* Tr iff X < T-»Element > 
/* B*/ T-»Left = Insert( X, T-»Left ); 
else 
/* 9*/ if X > T-»Element J 
/*10*/ T-»Right = Insert( X, T-»Right 3; 
/* Else X is in the tree already; we'll do nothing */ 


/*11*/ return T: /* Do not forget this line!! * f 





E422 插 人 元 素 到 二 叉 查 找 树 的 例 在 


4.3.5 Delete 
正如 许多 数据 结构 一 样 。 最 困难 的 操作 是 删除 。 一 日 发 现 要 被 删除 的 节点 , 我 们 就 需要 
考虑 几 种 可 能 的 情况 。 


如 果 节 点 是 一 片 树 叶 , 那么 它 可 以 被 立即 删除 。 如 果 节 点 有 一 个 儿子 , 则 该 节点 可 以 在 
其 父 节 点 调整 指针 绕 过 该 节点 后 被 删除 (为 了 清楚 起 锡 ， 我 们 将 明确 地 画 出 指针 的 指 问 ), 3L 


Hf 


图 4-23, itx. HERES TS A TO A, aR PS) ET OR a 


üt A AES ATS . 
6 
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A423 具有 :个 几 了 了 的 节点 (4}) 删 除 前 后 的 情况 


复杂 的 情况 是 处 理 有 具有 两 个 儿子 的 节点 ,一 般 的 删除 策略 是 用 其 本 于 树 的 最 小 的 数据 
{很 容易 找到 ) 人 入替 该 节点 的 数据 并 递归 地 删除 那个 节点 {现在 它 尾 室 的 }。 因 为 右 了 于 树 中 的 最 
小 的 节点 不 可 能 有 在 儿 子 , 所 以 第 二 次 Delete 删除 ) 要 容易 。 图 4-24 显示 一 村 初始 的 树 太 其 
中 一 个 节点 被 删除 后 的 结果 .， 要 被 期 除 的 节点 是 恨 的 左 几 子 ; 其 关键 宁 是 2。 它 被 石子 树 中 
的 最 小 数据 (3) 所 代 些 ,然后 关键 字 是 3 的 原 节 点 如 前 例 那 样 被 删 际 。 





图 4-24 ”删除 其 有 两 个 几 子 的 节点 (2) 前 后 的 情 沉 


图 4.25 中 的 程序 完成 删除 的 工作 , BEREH TS., 因为 它 沿 该 树 进 行 两 冻 搜 索 以 查 
找 和 删除 右 子 树 中 最 小 的 节点 。 写 一 个 特殊 的 DeleteMin ga V 容易 地 改变 效率 不 疝 的 缺 
eh, FRA TE Je BON TS 

如 果 删 除 的 次 数 不 多 , MAA (FAY) RR C lazy deletion) ， 当 一 个 元 素 皮 被 删 
除 时 ， 它 仍 备 在 树 中 ,而 是 只 做 了 个 被 册 除 的 记号 。 这 种 做 法 特别 是 在 有 重复 关键 子 时 很 六 
行 , 因为 此 时 记录 出 现 频率 数 的 域 可 以 减 Ls 如 果树 中 的 实际 节点 数 和 “被 删除 ”的 节点 数 相 
mj. 那么 树 的 深度 预计 只 上 升 一 个 小 的 常数 (为 什么 ?)》 因此 ， 存在 一 个 与 懒惰 删除 相关 的 非 
党 小 的 时 间 损 耗 。 再 有 ， 如 果 被 删除 的 关键 字 是 重新 插 人 的 ， 那么 分 配 一 个 新 单元 的 开销 号 
He T 
4.3.5 平均 情形 分 桥 

TORE, BE MakeEmpty 外 ， 我 们 期 望 前 一 节 所 有 的 操作 都 花费 O Clog NATAL, 因为 我 
们 用 常数 时 间 在 树 中 降低 了 一 技 ， 这 样 一 来 , 对 树 的 操作 大 致 减少 一 半 左 右 。 utc, BR Ma- 


78 BAF 


Searchirea 


Dalete( Elementiype X, Searchfree T ) 


| 
| Position TmpCell; 
| 















if( T == NULL ) 
Error& "Element not found" 3; 
glse 
ift X < T-»Elament ) /* Go left */ 
T-»Left = Delertet X, T-»Left 3; 
else 
if( X > T->Element ) /* Go right */ 
T-»Right = Delete( X, T->Left ); 
else /* Found element ta be deleted */ 
iff T-»Left && T-»Right 3  /* Two children */ 
{ 
/* Replace with smallest in right subtree */ 
TmpCel]l = FindMin( T-»Right ): 
T--Element = TmpCelt->£lement; 
T--Right = Delete( T-»EJement, T--Right ); 
} 
else /* One or zero children */ 
TmpCe!1l = T; 
if Y-»Left «= NULL } /* Also handles Q children */ 
T = T-»Right; 
else if( T-»Right == NULL 3 
T = T-»Left; 
freet impCel! 3; 
] 
return T; 
|” 


图 4-25 “MARA RA 


keEmpiy 外 ,所 有 的 操作 都 是 OCd), 其 中 d 是 包含 所 访问 的 关键 字 的 节点 的 深度 。 

我 们 在 本 节 要 证 明 , 假设 所 有 的 树 山 现 的 机 会 均等 , 则 树 的 所 有 节点 的 平均 深度 为 
O(log N)« 

_- 棵 树 的 所 有 节点 的 深度 的 和 称 为 内 部 路 径 长 (intermal path length)。 我 们 现在 将 要 计算 二 
叉 查 找 树 平均 内 部 路 径 长 , 其 中 的 平均 是 对 向 二 义 查找 树 中 所 有 可 能 的 插入 序列 进行 的 。 

A D(N) 是 具有 N 个 节点 的 某 棵 树 人 的 内 部 路 径 长 ,，D(1) = 0。 — BR N 市 点 树 是 由 
一 棵 i 节点 左 子 树 和 一 棵 (N 一 i 一 1) 贡 点 右 子 树 以 及 深度 为 0 的 一 个 根 节点 组 成 , 其 中 Os: 
< N，D(i) 为 根 的 在 子 树 的 内 部 路 径 长 。 但 是 在 原 树 中 , 所 有 这 些 节 点 都 要 加 次 一 度 。 同样 
的 结论 对 于 右 子 树 也 是 成 立 的 。 因 此 我 们 得 到 递归 关系 : 

DON) = Di + DIN -i-1)+N-1 
如 果 所 有 子 树 的 大 小 都 等 可 能 地 出 现 , 这 对 于 二 叉 查找 树 是 成 立 的 (因为 子 树 的 大 小 只 依赖 
于 第 一 个 揪 入 到 树 中 的 元 素 的 相对 的 秩 ), 但 对 于 二 叉 树 则 不 成 立 ,那么 DG) 8I DON - 2 - D 


的 平均 值 都 是 (1AN) D Do FH 
pin) = &[ 3; DG)]* N - 1 


在 第 7 章 将 遇 到 并 求解 这 个 递归 关系 , 得 到 的 平均 值 为 DCN) = OCN log N) AREST 
点 的 期 望 深度 为 D(iog N)。 作 为 一 个 例子 , 图 4-26 所 示 随 机 生成 的 500 个 节点 的 酝 的 节点 


平均 深度 为 9.98。 








图 4-26 ”一 棵 随机 生成 的 二 叉 查 找 树 


但是 ,上 来 就 断言 这 个 结果 意味 着 上 一 上 节 讨 论 的 所 有 操作 的 半 均 运行 时 间 是 O Clog N) 
并 不 完全 正确 。 原 因 在 于 删除 操作 , 我 们 并 不 清楚 是 否 所 有 的 一 文 查找 柑 邦 是 过 可 能 出 现 
的 。 特 别 是 ， 上 面 描 述 的 删除 算法 有 助 于 使 得 左 子 树 比 句子 树 深度 深 ,因为 我 们 总 是 用 右 开 
树 的 个 节点 来 代替 删除 的 节点 。 这 种 策略 的 准确 效果 仍然 是 林 知 的 , 但 它 似 平 只 是 理论 上 
的 恋 团 。 已 经 证 明 ， 如 果 我 们 交替 插 人 和 删除 B(N2) 次 , 那么 树 的 期 望 深度 将 是 OWN). 
在 25 万 次 随机 Insert/Delete 后 , 图 4-26 中 右 沉 的 树 看 起 来 明显 地 不 平衡 (平均 诛 度 = 
12.51), ME 4-27。 
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Ei 4.27. 1E GN? IK Insert/Delete 后 的 二 叉 查 找 树 


ERRER, Ri C Raha ICR AT RR ATRL E H 
P B3 CE LL TER CRISE fl IR] EE, TCR S] TERET ROR SHE REE dE, 但 是 , 没 
有 人 实际 上 证 明 过 这 一 点 。 这 种 现象 位 乎 主要 是 理论 上 的 问题 , 因为 对 于 小 的 树 上 述 效 果 根 本 
显示 不 出 来 , 甚至 更 奇怪 , 如 果 使 用 oCNT)Xf Inseri/Delete, 那么 笃 似 乎 林 以 得 到 平衡 ! 

上 上面 的 讨论 主要 是 说 明 ，, 明确" 平均 "意味 着 什么 一 般 是 极其 困难 的 ， 可 能 需要 一 些 假 
i. 这 些 假设 可 能 合理 , 也 可 能 不 合理 ， 不过， 在 没有 删除 或 是 使 用 懒惰 删除 的 情况 下 .可 
以 证 明 所 有 二 叉 查 找 树 都 是 等 可 能 出 现 的 ， 市 且 我 们 可 以 断言 : 上 述 那 些 操作 的 平均 运行 时 
lala EE O(log N). 除 像 上 上 面 讨论 的 一 些 个 别 情 形 外 ， 这 个 结 呆 与 实际 观察 到 的 情形 是 非常 
WITH). 

如 果 向 一 标 预 先 排序 的 树 输入 数据 那么 一 连 串 Insert 操作 将 收费 二 次 时 间 ， 而 链表 实 
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80 BAF 
现 的 代价 会 非常 巨大 , 因为 此 时 的 树 将 只 由 那些 没有 左 儿 子 的 节点 组 成 。 一 种 解决 办 法 就 是 
要 有 一 个 称 为 平衡 (batance) 的 附加 的 结构 条 件 ; 任何 节点 的 深度 均 不 得 过 深 . 

有 许多 一 般 的 算法 实现 平衡 树 。 但 是 ,大 部 分 算法 都 要 比 标 淮 的 二 了 叉 查 找 树 复 淋 得 多 ， 
而 且 更 新 要 平均 花费 更 长 的 时 间 。 不 过 , 它们 确实 防止 了 处 理 起 来 非常 麻烦 的 一 些 简 单 情 
É. FEL 我 们 将 介绍 县 老 的 一 种 平衡 查找 酝 , BI AVL 树 。 

另外 ， 较 新 的 方法 是 放弃 平衡 条 件 , 允许 树 有 任意 的 深度 , 但 是 在 每 次 操作 之 后 要 使 用 
一 个 调整 规则 进行 调整 , 使 得 后 面 的 操作 效率 更 高 。 这 种 类 型 的 数据 结构 一 般 怖 于 上 日 调 整 
《self-adiusting) 类 铬 构 。 在 二 叉 查 找 树 的 情况 下 ， 对 子 任 意 单 个 运算 我 们 不 再 保证 Oog N) 
的 时 间 界 , 但 是 可 以 证 明 任 意 连 续 M 次 操作 在 最 坏 的 情形 下 花费 时 间 为 OM log N)。 一 般 
这 足以 防止 令 人 环 手 的 最 坏 情 形 。 我 们 将 要 讨论 的 这 种 数据 结构 叫做 伸展 树 (splay tree): © 
IA HEB EAE A, 我 们 将 在 第 11 章 讨论 。 


4.4 AVL BÍ 


AVI (CAdelson-Velskii 和 Landis) 树 是 带 有 平衡 条 件 的 二 叉 查 找 树 。 这 个 平衡 条 件 必 须要 
容易 保持 , 而 且 它 贫 保证 树 的 深度 是 OUog N)。 最 简单 的 想法 是 要 求 左 右 子 树 共有 相同 的 
高 度 。 如 图 4-28 所 示 , 这 种 想法 并 不 强求 树 的 深度 要 浅 。 

另 一 种 平衡 条 件 是 要 求 每 个 节点 都 必须 要 有 相间 高 
度 的 天 子 树 和 右 子 树 。 如 果 空 子 树 的 高 度 定义 为 一 1( 通 
常 就 是 这 么 定义 ), 那么 只 有 有 具有 F- 工 个 节点 的 理想 平 
f& ftt (perfectly balanced tree) 满 足 这 个 条 件 。 因 此 , 虽然 这 
种 平衡 条 件 保 证 了 树 的 深度 小 , 但 是 它 太 严格 , 难以 使 
用 , SERRE, 

_ 棵 AVL 树 是 其 每 个 节点 的 左 子 树 和 右 子 树 的 高 度 。 图 428 REE OUS. AR 
最 多 差 1 的 二 叉 查找 树 。( 空 树 的 高 度 定义 为 - 1。) 在 图 ERT UT BURNER 
429 中 ,左边 的 树 是 AVL, 但 是 右边 的 梢 不 是 。 每 一 个 节点 (在 其 节点 结构 中 ) 保 留 高 度 
信息 。 可 以 证 明 , KAEH, 一 个 AVL 树 的 高 度 最 多 为 1. 44lcg(NN+2) — 1.328, 但 是 实际 
上 的 高 度 只 比 logN 稍微 多 一 些 。 作 为 例子 , 图 4-30 显示 一 棵 具有 最 少 节点 (143) 高 度 为 9 
的 AVL 树 。 这 樟树 的 左 子 树 是 高 度 为 ? 且 节 点 数 最 少 的 AVL 树 , 右 子 树 是 高 度 为 8 的 节点 
数 最 少 的 AVL 树 。 它 告诉 我 们 , 在 高 度 为 h W AVLA, 最 少 节点 数 SCAU SCGO- 
Sth-1)+ S(h -22 *1 Eris MF A=0,S(A)H1; h-1, SCA) =20 函数 SCA) S SEQSCRE 
usu, Bulb E BIN F AVL 树 的 珊 度 的 党 。 

因此 , 除去 可 能 的 插 人 外 {我 们 将 假设 懒 情 删除 )， 所 有 的 树 操 作 都 可 以 以 时 间 O(log NOTA 
行 。 当 进行 播 人 操作 时 ， 我 们 需要 更 新 通 向 根 和 节点 路 径 上 那些 节点 的 所 有 平衡 信息 ， 而 播 人 
操作 隐 含 着 困难 的 原因 在 于 ; 插 人 一 个 节点 可 能 破坏 AVL 树 的 特性 。{ 例 如 , 将 6 插入 到 图 
4-29 中 的 AVL 树 中 将 会 破坏 关键 字 为 8 的 节点 平衡 条 件 。) 如 果 发 生 这 种 情况 , 那么 就 要 把 
性 质 恢复 以 后 才 认 为 这 一 步 播 人 完成 。 雪 实 上 上， 这 总 可 以 通过 对 树 进 行 简单 的 修正 来 做 到 ， 
FREY 3& d (rotation). 

在 播 人 以 后 ， 血 有 那些 从 插入 点 到 根 节点 的 路 径 上 的 节点 的 平衡 可 能 被 改变 ， 因为 只 有 
这 些 节 点 的 子 树 可 能 发 生变 化 。 当 我 们 沿 着 这 条 路 径 上 行 到 根 并 更 新 平衡 信息 时 , 我 们 可 以 
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找到 -一 个 节点 , 它 的 新 平衡 破坏 了 AVL 条 件 。 我 们 和 将 指出 如 何在 第 一 个 这 样 的 节点 5 即 最 涂 
的 节点 ) 重 新 平衡 这 棵 树 ， 并 证 明 , 这 一 重新 平衡 保证 整个 树 满 足 AVL 特性 。 

让 我 们 把 必须 重新 平衡 的 节点 叫做 。 由 于 任意 节点 最 多 有 了 两 个 儿子, 因此 高 度 不 平 黎 
M. o 点 的 两 标 子 和 树 的 高 度 差 2。 容 易 看 出 , 这 种 不 平衡 可 能 出 现在 下 面 四 种 情况 中 

1. 对 a 的 左 儿 子 的 左 子 树 进 行 一 次 插入 。 

2. 对 a 的 左 儿 于 的 右 子 树 进 行 一 次 插入 。 

3. 对 a 的 右 儿 子 的 左 子 柑 进行 一 次 插入 。 

4. 对 o 的 右 儿 子 的 右 子 树 进 行 : -次 搬入 ， 

情形 | 和 4 是 关于 a 点 的 镜像 对 称 , 而 2 和 3 是 关于 a 点 的 镜像 对 称 。 因 此 , BUE ER 
有 两 种 情况 ,当然 从 编程 的 角度 来 看 还 是 四 种 情形 . 

第 一 种 情况 是 播 和 人 发生 在 “外 边 " 的 情况 ( 即 左 - 左 的 情况 或 右 一 右 的 情 沈 )， 该 情况 通过 
RT AY AY — UK # #44 ( single rotation) 而 完成 调整 - 第 二 种 情况 是 插入 发 生 在 “内 部 TA B 
左 - 厂 的 情况 或 石 - 左 的 情况 )， 该 情况 通过 稍微 复杂 些 的 双 旋 转 (double rotation) KARHE. 我 
们 将 会 看 到 ,这些 部 是 对 树 的 基本 操作 ， 它们 多 次 用 于 平衡 树 的 一 些 算 法 中 -本 节 其 余部 分 
将 描述 这 些 旋 转 , 证 明 它 们 足以 保持 树 的 平衡, JEN ESSI AVL 树 的 一 神华 正 式 实 现 方法 : 
第 42 章 描述 其 他 的 平衡 树 方法 , 这 些 方法 着 眼 于 AVL 树 的 更 仔细 的 实现 - 
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4.4.1 单 旋转 

图 4-31 显示 单 旋 转 如 何 调整 情形 1。 旋 转 前 的 图 在 左边 ， 而 旋转 后 的 图 在 右边 。 计 我 们 
上 米 分 析 具 体 的 做 法 。 节 点 &; 不 满足 AVL 平衡 特 人 性， 因为 它 的 左 子 树 比 右 子 树 深 2 层 ( 图 中 
问 的 几 条 虚线 标示 树 的 各 层 )。 该 图 所 描述 的 情况 只 是 情形 1 的 一 种 可 能 情况 ,在 椰 人 之 六 


— kh WE AVL 特性 , 但 在 播 人 之 后 这 种 特性 被 破坏 了 。 子 树 了 已 经 长 出 一 层 , 这 使 得 它 比 于 


树 Z 深 出 2 层 。Y 不 可 能 与 新 XX 在 同一 水 平 上 ,因为 那样 k 在 插入 以 前 就 已 经 失去 平衡 
T: Y 也 不 可 能 与 Z 在 同一 层 上 , 因为 那样 1 就 会 是 在 通 向 根 的 路 径 上 人 破坏 AVL 平 衡 条 件 
的 第 -个 节点 。 





图 4-31 调整 情形 1 的 单 旋转 


为 使 树 恢复 平衡 , 我 们 把 X 上 移 一 层 , 并 把 Z FS. IER, 此 时 实际 上 超出 了 
AVL 特性 的 要 求 。 为 此 , 我 们 重新 安排 节点 以 形成 一 柑 等 价 的 树 ， 如 图 4-31 的 第 二 部 分 所 
示 。 抽 人 象 地 形容 就 是 : 把 树 形象 地 看 成 是 柔软 灵活 的 , 抓 住 节点 ki 闭 上 你 的 双眼 , Se 
me, 在 重力 作用 下 , k 就 变 成 了 新 的 根 。 二 又 查 找 椅 的 性 质 告诉 我 们 , 在 原 树 中 k> by, 
于 是 在 新 树 中 h 变 成 了 上 &| 的 右 儿 子 , X AZ 仍然 分 别 是 | 的 左 儿 子 和 上 的 右 儿 子 。 子 树 
Y 包含 原 树 中 介 于 M k 之 间 的 那些 节点 , 可 以 将 它 放 在 新 粳 中 2 的 左 儿子 的 位 置 上 ,这 
样 ， 所 有 对 顺序 的 要 求 都 得 到 满足 。 

这 样 的 操作 只 需要 一 部 分 指针 改变 , 结果 我 们 得 到 另外 一 棵 二 叉 查找 椅 ， 它 是 一 标 
AVL 树 , 因为 X 向 上 移动 了 一 屋 ，Y 停 在 原来 的 水 平 上 , 而 Z PEE. RD ki DA 
E AVL BOR, 而且 它们 的 子 树 都 恰好 处 在 同一 高 度 上 。 不 仅 如 此 , 整个 树 的 新 高 度 恰恰 
与 插入 前 原料 的 高 度 相同 , 而 插入 操作 却 使 得 子 树 X 长 高 了 。 因 此 , 通 向 根 节点 的 路 径 的 
高 度 不 需要 进一步 的 修正 , 因而 也 不 需要 进一步 的 旋转 。 图 4-32 显示 在 将 6 插入 左边 原始 
的 AVL 树 后 节点 8 便 不 再 平衡 。 于 是 , 我 们 在 7 和 8 ZAR KARE, BRA 
的 树 。 





图 4.32 插入 5 破坏 了 AVI. 特 性， Tes mem VARKER 
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Hel 4-33 单 旋转 覆 复 情形 4 


(E 好 我 们 较量 提 到 的 , 情形 4 代表 一 种 对 称 的 情形 。 侠 4-33 Fe Bee mer FTH. LESE 
位 演示 一 个 稍微 长 一 些 的 例子 ， 根 设 从 初始 的 空 AVL AAA KEE 3.291, 然后 依 
序 插 人 4 到 7 了 7。 在 插 人 关键 字 | 时 第 一 个 问题 出 现 了 ，AVL 特性 在 根 处 被 破坏 。 我 们 在 根 二 
其 左 儿 子 之 间 施 行 单 旋转 修正 这 个 问题 。 下 面 是 旋转 之 前 和 之 后 的 两 棵 笃 ， 
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a 旋转 之 前 旋转 之 后 


图 中 虚线 连接 两 个 节点 , 它们 是 旋转 的 让 体 ， 下 阁 我 们 搬入 关键 宁 为 4 的 节点 ,这 没有 问 
题 , 但 插入 5 破坏 了 在 节点 3 处 的 AVL 特性 , te ee OO Rh. BRIEFS ie A 
ish, REAR DAE: 树 的 其 余部 分 必须 知晓 该 变化 。 如 本 例 中 节点 二 的 石 儿子 必 
须 生 新 设置 以 指向 4 来 代替 3。 这 一 点 很 容易 让 记 ， 从 而 导致 树 被 骸 坏 (4 就 会 地 不 可 访 
IE). 
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下 而 我 入 搬 估 6。 这 在 根 节点 产生 一 个 平衡 问题 ， 因 为 它 的 左 子 树 高 虎 是 0 而 石 THE 
度 为 2。 困 此 我 们 在 根 处 在 2 各 4 之 间 实 施 UK EAS 





E [5 l 
旋转 之 前 X 旋转 之 后 


n 


sek ag £t et 2 是 4 的 一 个 儿子 而 4 GOR PIA TE 2 的 新 的 右 了 树 。 在 该 子 树 二 
的 每 - -个 关键 字 均 在 2 和 4 之 间 , 因此 这 个 变换 是 成 立 的 。 我 们 插入 的 下 一 个 关键 子 丰 7, 


它 导 致 另外 的 旋转 : 





旋转 之 前 


4.4.2 WHE 
上 面 描述 的 算法 有 一 个 问题 如 图 4-34 所 示 , 对 于 情形 2 和 3 上 面 的 做 法 无 效 。 问 题 在 
TI YAR, 单 旋转 设 有 减低 它 的 座 度 。 解 决 这 个 问题 的 双 旋 转 在 贸 4-35 中 表 出 。 





图 4-35 左 - 右 双 旋 转 收 复 情 形 2 


ER 434 中 的 子 树 Y 已 经 有 有 一 项 插入 其 中 , 这 个 事实 保证 它 是 非 空 的 。 因 此 ,我 们 可 
以 假设 它 有 一 个 根 和 两 标 子 树 。 于 是 , 我 们 可 以 把 整 棵 树 看 成 是 四 梨子 树 由 3 个 节点 连接 。 
如 图 所 示 , nS B 或 树 C 中 有 一 棵 比 D 深 两 层 ( 除 非 它 们 都 是 空 的 ), 但 是 我 们 不 能 肯 完 
是 哪 一 棵 。 事实 上 这 并 不 要 紧 , 在 图 4.35 中 B 和 C 都 被 画 成 比 DD (8 15:8. 

为 了 重新 平衡 , 我 们 看 到 , 不 能 再 让 作为 根 了 , 而 图 4-34 所 示 的 在 &s P ki ZM RINE 
转 又 解决 不 了 问题 , 惟一 的 选择 就 是 把 ko 用 作 新 的 根 。 这 迫使 ki 是 & 的 左 儿 子 ，&s EE 
的 右 儿 子 , 估 而 完全 确定 了 这 四 标 树 的 最 终 位 置 。 容 易 看 出 , 最 后 得 到 的 树 满足 AVL 出 的 
特性 , 与 单 旋转 的 情形 一 样 , 我 们 也 把 树 的 高 度 恢复 到 插入 以 前 的 水 平 , 这 就 保证 所 有 的 重 
新 平衡 和 高 度 更 新 是 完善 的 。 图 4-36 指出 , 对 称 情形 3 也 可 以 通过 双 旋 转 得 以 修正 。 在 这 两 
种 情形 下 , 其 效果 与 先 在 a 的 下 子 和 孙子 之 间 旋 转 而 后 再 在 和 它 的 新 儿子 之 间 旋 转 的 效 未 
是 相同 的 。 

我 们 继续 在 前 面 例 子 的 基础 上 以 倒序 插入 关键 字 10 到 16, 接着 搬入 8, 然后 再 插入 9. 
AIG 容易 ,因为 它 并 不 破坏 平衡 特性 , 但 是 插入 15 就 会 引起 在 节 成 7 处 的 高 度 不 平衡 。 
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图 4.36 A- ANE RE AE 3 5 
1 
SNH 3, 需要 通过 -次 右 - 左 双 旋 转 来 解决 。 在 我 们 的 例子 中 ,这 个 证 堪 双 旋 转 将 涉及 US 
7, 16 和 415， 此 时 , 4, 是 具有 关键 字 7 的 节点 , A. 是 内 有 关键 字 LON TA, mM k ERAK 
Bee 15 ER. FBLA B. CHD 都 是 空 树 。 





3 1 ky ky 
eZ i 48) EIE G o 


下 面 我 们 插入 14, CUP E TOUR. WE EAH, E 
将 涉及 6、15 和 7。 在 这 种 情况 下 , b, 是 具有 关键 学 6 的 节点 ，&2 是 共有 关键 字 7 了 的 节点 ， 
fii 6, 是 具有 关键 字 15 的 节点 。 子 树 A 的 根 在 关键 字 为 5 的 节点 上 , TN B ASTM, 它 是 
美 键 字 7 的 节点 原先 的 左 儿 子 , 子 树 C 置 根 于 关键 字 14 的 节点 D. E. DD IREX 
ae ON 16 ATE 





ks, 
16 
旋转 之 前 14) 


MENERA 13, 那么 在 根 处 就 会 产生 一 个 不 平衡 - 由 于 13 不 在 4 和 7 之 问 ， 因此 我 
们 知道 一 次 单 旋转 就 能 完成 修正 的 工作 。 
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12 的 插 人 也 需要 一 个 单 旋转 ， 





为 了 插 和 人 11, 还 需要 进行 一 个 单 旋转 ， 对 于 其 后 的 10 的 插 人 也 需要 这 样 的 旋转 。 我 们 
插 和 人 8 不 进行 旋转 ,这 样 就 建立 了 一 棵 近乎 理想 的 平衡 树 . 





最 后 , 我 们 插 人 9 以 演示 双 旋 转 的 对 称 情形 。 注 意 , 9 引起 含有 关键 字 10 的 节点 产生 不 
平衡 。 册 于 9 在 10 和 8 之 间 (8 是 通 向 9 的 路 径 上 的 节点 10 的 儿子 ), 因此 需要 进行 一 个 双 
iis] 旋转 , 我 们 得 到 下 面 的 树 : 





现在 计 我 们 对 上 面 的 讨论 作 个 总 结 。 除 几 种 情形 外 ,编程 的 弓 节 是 相当 简单 的 。 为 将 天 
键 字 是 X 的 一 个 新 节点 插 人 到 一 哥 AVL RET PE, 我 们 递归 地 将 X 捅 人 到 人 的 相应 的 于 
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s. 那么 我 们 根据 蕊 以 及 于 各 ibas Mos cree ieee cm E Py it YS E H 
fug GHA BRP HERE). MOSER HA. H FoR meee RE AA a, PIEI 
2 Hb 5 E 3E BUS RE ES ae SBI RS. SRT, BOSE BR a T L 
TA SER GENE), BEITE ACA TR AREI ASE AVL RI, 

5j APRESS LBS BRB Se. INT AI GHI kie PS EN, 
BREET). GORA ik AK, MIARA ae a ARN, U, meen 
个 益 。 这 么 做 将 避免 平衡 因 了 的 重复 计算 , (ee REIHE. 最 后 的 程 订 多 多 少 少 路 
比 在 短 一 个 节点 仓储 高 度 时 复杂 。 如 采编 写 递归 程序 , PA AEE RS A A. 
此 是 ， 通 过 存储 平衡 因子 所 得 到 的 些微 隐 速 度 优 势 很 难 抵消 清晰 度 和 相对 向 明 性 的 损 拓 :不 
d 由 于 大 部 分 机 器 存储 的 和 最 小 单位 是 8 个 二 和 进 制 位 , 内 此 所 用 的 空间 量 洒 可 能 有 任何 
差别 。8 位 使 我 们 存储 高 达 255 的 绝对 沿 度 ， 既 然 树 是 平衡 的 ， 当 然 也 就 不 可 想像 这 会 少 到 
yn ao). 

4& r CERE. 现在 准备 编写 AVL 树 的 - 些 例 程 。 不 过 , RT aa te. 其 
余 的 留 作 练习 。 首 先 , RIESE H, 这 些 上 启明 在 图 4-37 中 给 出 。 TET ECTS ER TUE 
的 测 数 来 返回 节点 的 高 度 。 这 个 萄 数 必须 处 理 NULL 指引 的 恼人 的 情形 .该 程序 在 图 4-38 [119 
中 给 出 ， 基 本 的 插入 例 程 写 起 来 很 容易 ， 因 为 它 主要 由 一 些 蝴 数 再 用 组 成 ( 见 峡 4-39) . 


F 


#ifndėf _AviTreg_H 


| struct AvlNode; 
typedef struct AviNode *Pos?tion; 
typedef struct AvINode *AviTree; 


l 
AvlTree MakeEmpty( Avitreé T 33 

Position Find( ElementType X, AvlTree | j; 
Position FindMin( Avilrea T >: | 
| Position FindMax( AvlTreé T 3; 

| AvlTree Insert( ElementType X, AviTree T ): 
| AviTree Delete( ElementType X, AviTree T ); | 
| ElementType Retrieve( Position P 3; | 
| 


sendif /* _AviTree_H */ 
/* Place in the implementarion file */ 
Struct AviNode 
| ElementType Etement: 
AvitTree Left: 


AvlTree Right; 
TH Height: 


| h 


图 4.37 AVL AN APR 


Poo, 


对 于 图 4-40 中 的 那些 树 ，SingleRetateWithLef 12/4539 BU Bk BIRT, IR Ei $8 fu] 
新 要 的 指针 , SingleRotateWithRight 做 的 于 作 恰好 在 到。 程序 在 图 4-41 中 表 出 ， 

我 们 要 写 的 最 后 一 个 丽 数 完成 图 4-42 PHETERUOUER , TERY ERIS 4-33 A 

好 AVL. BATHE Ze ^P: pef A ee. Je RR HL ERE RTOG EE 2, Ze Tt REA E e 
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好 的 策略 。 


static int 
Height( Position P } 
1 


Tf P om NULL ) 


return -1; 
else 
return P->Height; 





图 4-38 计算 AVL 节点 的 高度 的 函数 


AvlTree 
Insert( EtementType X, AvlTree T ) 


3fTC T == NULL 3 
i 
/* Create and return a one-node tree */ 
T = malloc( sizeof struct AviNode ) 3; 
iff T == NULL } 
Fatattrror¢ "Out of space!!!" 9; 
eise 
{ 
T->Element = X; T-»Height = 0; 
T-»Left = T-»Right = NULL; 
} 
] 
else 
if( X < T-»Element ) 


T->Left = Insert( X, T-»left ); 
if( Height( T-»Left ) - Height( T--Right ) == 2 J 
ift X < T-»Left--Element ) 
T = 5ingleRotateWithLeft( T "E 
else 
T = DoubleRotateWithLeft( T 5; 
} 
eise 
ifi X > T-»Element ? 
{ 
T-»Right = Insert( X, T-»Right M 
if Height( T-»Right ) - Height T-»Left ) == 2 ) 
if( X > T-»Right->Element ) 
T = SóngleRotatewithRight( T 5; 
else 
DoubleRotatewithRight( T 2; 


I E] 
/* Else X is in the tree already; we'll do nothing */ 


T--Height = Max€ Height( T-»teft ), Height( T-»Right 3 2 + li 
return T: 





图 439 E AVL Edi AD A3 BU e Xx 
Ea E 
ky) 7 A 3 


A 2S AN LS 


Baa 单 旋转 


zu 


/* Perform a rotate between a node CK2Y and its left child */ | 


p —————————————————M——— —— 
| /* This function càn be called only if K2 has a left child */ 
| /* Update heights, then return new root */ 


static Position 
SingleRotateWithLeft( Position K2 ) 


Position Kl; 


| Kl = K2->Left; 
K2->Left = Kl-»Right; | 
| Kl-»Right = K?; 
K2-»Height = Max( Height( K2->Left }, | 
Height K2-»Right ) 
Kl-»Height = Max( Height( Ki->Left }, K2-sHeight | 


urn Su 


return KL; A Mew root */ 








— 


图 4-41 执行 单 旋转 的 例 程 





图 4-12. 双 旋 转 





/* This function can be called only if K3 has a left */ 
/* child and K3's Jeft child has a right child */ 

/* Do the left-right double rotation */ 

/* Update heights, then return new root */ 


static Position 
DaubleRotatewithLeft( Position K3 J 
{ 
/* Rotate between K1 and K2 */ 
K3-»Left = SingleRotateWwithRightt K3-»Left ); 


| /* Rotate between K3 and K2 */ | 
return SingleRotatewithLeft( K3 5; 





[] 4-43. EITE STRE 


4.5 伸展 树 


于 在 我 们 描述 一 种 相对 简单 的 数据 结构 ， 叫 向 伸 腻 树 (splay tree). E DUE SS PETERS TE 
BEBE M 次 对 树 的 操作 最 多 花费 〇 (CM log 以) 时 间 。 盟 然 这 种 保 让 并 不 排除 任意 一 次 操作 
EH O(N) 时 间 的 可 能 , 而 旦 这 样 的 界 也 不 如 每 次 操作 最 坏 情 形 的 界 O(log N Milk z 5i, 但 
中 实际 效果 十-- 样 的 ; 不 存在 坏 的 输入 序列 . ROR, 24 M KERE IEI E A n AE 
运行 时 间 为 DOOMEFCN)) 时 ， 我 们 就 说 它 的 捧 还 (amortizcd) 运 行 时 间 为 OLF(N))。 因 此 ,一 
棵 伸展 树 每 次 操作 的 摊 还 代价 是 O(log N). 经 过 一 系列 的 操作 之 后 ,有 的 可 能 花费 时 间 多 
-- 些 , 有 的 可 能 要 少 一 些 。 
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坏 ， 只 要 它 相对 不 党 发 生 就 行 。 任 何 一 次 访问 ,即使 花费 OCN), (ARERR. TRH 
找 树 的 问题 在 于 ,虽然 一 系列 访问 整体 都 有 可 能 发 生 不 良 操 作 , 但 是 很 罕见 。 此 时 ， 累 积 的 
运行 时 间 很 重要 。 具 有 最 坏 情 形 运 行 时 间 OCN) 但 保证 对 任意 M 次 连续 操作 最 多 花费 
OCM log N) 运 行 时 间 的 查找 树 数据 结构 确实 可 以 满意 了 ,因为 不 窒 在 坏 的 操作 序 询 ， 

如 果 任 意 特 定 操 作 可 以 有 最 坏 时 间 界 O CN) , 而 我 们 仍然 要 求 一 个 O(log N) 的 挫 述 时 
间 界 , 那么 很 清楚 ， 只 要 一 个 节点 被 访问 , TDI. DU, 一 已 我们 发 现 一 个 深层 
的 节点 ,我们 就 有 可 能 不 断 对 它 进行 Find 操作 。 如 果 这 个 节点 不 改变 位 置 ,而 每 次 访问 义 秦 
$t O(N), 那么 M 次 访问 将 花费 OL M:N) 的 时 间 。 

伸展 树 的 基本 想法 是 ， 当 一 个 节点 被 访问 后 , 它 就 要 经 过 一 系列 AVL 树 的 旋转 被 放 到 
根 上 。 注 意 , 如 果 一 个 节点 很 深 , 那么 让 其 路 径 上 就 存在 许多 的 节点 也 相对 较 深 , 通过 于 新 
构造 可 以 使 对 所 有 这 些 节 点 的 进一步 访问 所 花费 的 时 间 变 少 。 因 此 ,如 果 节 点 过 次 ,那么 我 
们 还 要 求 重 新 构造 应 具有 平衡 这 棵 树 { 到 某 种 程度 ) 的 作用 。 除 在 理论 上 给 出 好 的 时 间 失 外 ， 
这 和 圳 方法 还 可 能 有 实际 的 效用 , 因为 在 许多 应 用 中 当 一 个 节点 稚 访 问 时 ,， 它 就 很 可 能 不 久 南 
被 访问 到 。 研 究 表 明 , 这 种 情况 的 发 生 比 人 们 预料 的 要 频繁 得 和 多。 另外, 伸展 树 还 不 要 求 保 
留 高 度 或 平衡 信息 ， 因 此 它 在 某 种 程 庶 上 节省 空间 并 简化 代码 (特别 是 当 实现 蚀 程 经 过 审慎 
考虑 而 被 写 出 的 时 候 )。 
4.5.1 一 个 简单 的 想法 

实施 上 面 描述 的 重新 构造 的 一 种 方法 是 执行 单 旋转 , 从 下 向 上 进行 。 这 意味 着 我 们 将 在 
访问 路 径 上 的 每 一 个 节点 和 它们 的 父 节点 实施 旋转 。 作 为 例子 ,考虑 在 下 面 的 树 中 对 | 进 
行 一 次 访问 (一 次 Find) 之 后 所 发 生 的 情况 。 
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然后 ， 我 们 在 ki H k 之 加 旋转, (EI PRR, 


Z å C D 





这 些 旋转 的 效果 是 将 & 一 直 推 向 树 根 , 使 得 对 k 的 进一步 访问 很 容易 (暂时 的 )。 不 足 
的 是 它 把 另外 一 个 节点 (As3) 几 乎 推 向 和 e 以 前 同样 的 深度 。 疝 对 那个 节点 的 访问 又 将 把 妇 
外 的 节点 向 深 处 推进 , 如 此 等 等 。 虽 然 这 个 策略 使 得 对 e, 的 访问 花费 时 间 减 少 , 但 是 它 并 没 
有 基 显 地 改变 {原先 ) 访 问 路 径 上 其 他 节点 的 状况 事实 上 可 以 证 明 , 对 于 这 种 策略 将 会 仔 在 
一 .系列 M 个 操作 共 需 要 9 (M:N) 的 时 间 , 因此 这 个 想法 还 不 够 好 。 证 明 这 件 扣 最 简单 的 万 
法 中 考虑 向 初始 的 空 树 播 人 关键 字 1, 2.3. 000, N 所 彤 成 的 树 (请 将 这 个 例子 算出 ) EIC 
得 到 一 株 树 ， 这 标 树 只 由 一 些 左 儿 子 构成 。 外 于 建立 这 棵 树 前 其 花 费时 间 为 OCN), 因此 这 
未 必 就 有 多 坏 。 问 题 在 于 访问 关键 字 为 1 的 节点 花费 ,N 一 1 个 单元 的 时 间 。 在 这 些 旋转 元 
成 以 后 ,对 关键 字 为 2 的 节点 的 一 次 访问 花费 N 一 2 个 单 苑 的 时 间 。 依 这 访问 所 有 关键 二 
aay Bart BESI = Q(N?). 在 它们 都 被 访问 以 后 , 该 全 转变 加 原始 状态 , ARITE E 
复 这 个 访问 顺序 。 
4.5.2 展开 

时 开 fSplaying) 的 思路 类 似 于 前 而 介绍 的 旋转 的 想法 ,不 过 在 旋转 如 何 实施 上 我 们 稍 筱 
有 些 选 岩 的 余地 。 我 们 仍然 从 底部 向 上 沿 着 访问 路 径 旋转 : 令 X 是 在 访问 路 径 上 的 一 个 (于 
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AQ). 我 们 将 在 这 个 路 径 上 实施 旋转 操作 。 如 果 X 的 父 节 点 是 树 根 ,那么 我 们 只 要 旋转 
X 和 树 根 。 这 就 是 沿 着 访问 路 径 上 的 最 后 的 旋转 - 否则 ，X 就 有 父亲 (了) 和 祖父 (上 G), 存在 
两 种 情况 以 及 对 称 的 情形 要 考虑 。 第 一 种 情况 是 之 子 形 {(zig-zag) 情 形 ( 见 图 4-44). RE, X 
是 右 儿 子 的 形式 , P 是 左 儿 子 的 形式 (反之 亦 然 )。 如 果 是 这 种 情 帝 ,那么 我 们 就 执行 一 次 像 
AVL 那样 的 双 旋 转 。 否 则 ,出 现 另 一 种 一 字形 {zig-zig) 情 形 : X 和 PP RERE ES, MH 
都 是 右 几 子 。 在 这 种 情况 下 , 我 们 把 图 4-45 TARP ERRA ANH. 





图 4-44 之 字形 iZig-zag) 情 形 


(G) ON 
(P) = 
CREE 
AN AN SO 2 


126 图 4-45 一 字形 (Zig-zig) 情 形 


作为 例子 , 考虑 来 自 最 后 的 例子 中 的 树 , 对 & 执行 一 次 Find: 


展开 的 第 一 步 是 在 ,显然 是 一 个 之 字形 , 因此 我 们 用 ki kz s 执行 一 次 标准 的 AVL X 
旋转 。 得 到 如 十 的 树 。 
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Tr e, REF PRE :个 一 字形 , 因此 我 们 用 上 、As 和 es 做 一 字形 旋转 . AEG IE - 


i 
i T-——— 


On OO. 


L DN c A 
A A LDN 

EB BR M — hes RE tb ke, (Ee HR 4s XE DATED EE AR AR, m AR A 
RIEKE PAAR SP APRA ORR IP — EE PEDRO SP AEK) 

再 来 考虑 将 关键 字 为 1. 2,3, NAA SR ee. OB TE n] 
EVER OCN) 时 间 并 产生 与 一 些 简单 旋转 结果 相同 的 树 。 图 4-46 指出 在 关键 字 为 1 的 节 
点 展开 的 结果 .区 别 在 于 , 在 对 关键 字 为 1 的 节点 访问 (花费 N - 1 个 单元 的 时 间 ) 之 后 , 对 
关键 字 为 2 的 节点 的 访问 只 花费 N72 个 时 和 间 单 元 而 不 是 N 一 2 个 时 间 单 元 ; 不 存在 像 忆 前 
那么 深 的 节点 。 


(7) CT T CTS 
(f 6 (e ~ A 4 
X e 
9 — ! ^ — “TY -一 M4 ^Y 
Meet Mou 
4 ol B" 2^ (5 
. X 
3 CTS £3 ^ 63^ 
- M 
e fT 
V bun 


M446 在 节点 上 展开 的 结果 


对 关键 子 为 2 的 节点 的 访问 将 把 这 毕节 点 带 旬 距 根 NA 的 深度 范围 之 内 . 并 由 如 此 进行 下 
$ HARRE KHH log NUN = 7 的 例子 太 小 , 不 能 很 好 地 看 清 这 种 效果 )。 图 4-47 到 图 4-55 Yr 
示 在 32 个 节点 的 桂 中 访问 关键 字 1 到 9 的 结果 , 这 棵 树 最 初 只 含有 左 儿 子 ， 我 们 从 伸 尾 树 得 不 
到 有 简单 旋转 策略 中 常见 的 那 种 低 效率 的 坏 现象 。( 实 际 上 , 这 个 例子 只 是 一 -种 非常 好 的 情 帝 
有 -个 相当 复杂 的 证 朋 指 出 . 对 于 这 个 例子 ，N 次 访问 共 标 费 O(N) 的 时 间 .) 

ue IS RUT RA ER SE, MWA IK TG PBB HE IE E PETRUM 
间 的 时 候 , xdi Ao MEE E 26. “EDI RENTER TD BIN xx Et ite 4 JU AS UE 8 
其 本 有 省。 极端 的 情形 是 经 过 若 下 插 人 而 形成 的 初始 树 。 所 有 Aud A FE e SC n] a REED 
花费 常数 时 间 的 操作 。 此 时 , FRIAS - FRE. 查 是 运行 却 比 预计 的 快 、 从 面 总 的 
较 少 运行 时 间 补偿 了 损失。 这 样 ， 少数 摧 焉 麻烦 的 访问 孝 留 给 我 们 一 标 几 平 是 平衡 的 树 ， 其 
代价 是 我 们 必须 返还 其 些 已 经 省 下 的 时 间 。 我 们 将 在 第 11 章 证 明 的 主 此 定理 指出 ， 振 个 换 
作 绝 不 会 落后 O(log N) 这 个 时 间 ; 我 们 总 是 遵守 这 个 时 间 ， 即使 符 尔 有 些 不 良 操作 。 

我 们 可 以 通过 访问 要 被 删除 的 节点 实行 删除 操作 :- CARROT A EES aD, BR 
除 该 节点 ， 则 得 到 两 棵 子 笠 T, Te AFT FED. 如 果 我 们 找到 Ti PM RAL 
GEAR. 那么 这 个 元 素 就 被 旋转 到 T, 的 根 下 , 而 此 时 Ty 将 有 一 个 没有 右 儿 子 的 根 。 
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图 4-49 ”将 前 面 的 树 在 节点 3 处 展开 
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我 们 可 以 使 Te 为 石 儿子 从 而 结束 删 陈 。 

对 伸展 树 的 分 析 很 困难 . 因为 树 的 结构 经 常 变化 。 另 - 方面 , 伸展 树 的 编程 要 比 AVL 
竺 简单 得 多 , 这 是 因为 要 考虑 的 情形 少 并 且 没 有 平衡 信息 需要 存储 。 实 际 经 验 指出 , 在 实践 
四 它 可 以 转化 成 更 快 的 程序 代码 , 不 过 这 种 状况 还 远 非 完美 ， 最后, 我 们 指出 , PRE TIL 
种 变化 , 它们 在 实践 中 甚至 运行 得 更 好 、 有 一 种 变化 在 第 12 BPR RPA. 
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图 4-55 MERETUR OE 1 a 9 RERO 
4.6 WENED 
sro BH BERT HEY, 因而 按照 排序 的 顺序 列 出 所 有 的 关键 字 会 很 篇 
8&, 图 4-56 中 的 递归 过 程 就 是 进行 这 项 工作 的 。 


void 
PrintTree( Searchiree T ) 


ifC T !- NULL } 


PrintTree( T-»Left 3; 
PrintElement( T-»Element 1; 
PrintTree( T->Right ); 

】 


} 





4-56 按 顺 序 打印 二 叉 查 找 持 的 例 程 


毫 无 疑问 , 该 过 程 能 够 解决 将 关键 字 排序 列 出 的 问题 。 正 如 我 们 前 面 看 到 的 , 这 类 例 程 
当 用 到 树 上 的 时 候 则 称 为 中 序 遍 历 ( 由 于 它 依 序列 出 了 关键 字 , AURA). PEED 
的 一 般 策 略 是 首先 遍历 左 子 树 , 然后 是 当前 的 节点 , 最 后 遍历 右 子 树 。 这 个 算法 的 有 趣 部 分 
除 它 简 单 的 特性 外 , 还 在 于 其 总 的 运行 时 间 是 O(N)。 这 是 因为 在 树 的 每 一 个 节点 处 进行 的 
工作 都 是 常数 时 间 的 .每 一 个 节点 访问 一 次 ， 而 在 每 一 个 节点 进行 的 工作 是 检测 是 否 
NULL. 建立 两 个 过 程 调用 并 执行 PrintElement。 由 于 在 每 个 节点 的 工作 花费 常数 时 间 以 及 


d 907 
ARA N 个 节点 ,因此 运行 时 间 为 O(N)， 

有 时 我 们 各 要 先 处 理 黄 个 子 树 然 后 才能 处 理 当 前 节点 例 旭 ,为 了 计算 - 个 节点 的 高 
Et. 我 们 需要 知道 它 的 两 棵 子 树 的 高 度 ， 图 4-57 中 的 程序 就 是 计算 高 度 的 ”由 于 检查 一 些 
特殊 的 情 沈 总 是 有 益 的 一 一 当 涉 太 递 上 时 尤其 重要 ， 内 此 要 注意 这 个 例 程 上 启明 树叶 -的 陋 度 为 
毒 ,这 是 正确 的 这 种 一 般 的 侦 历 脑 序 叫做 后 庆 遍 历 , 我 们 在 前 面 也 见 到 过 因为 在 每 个 节 
点 的 工作 花 绚 常数 时 间 ， 折 以 总 的 运行 时 间 也 是 OCN). 

我 们 多 过 的 第 一 种 常用 的 幅 历 格式 力 先 序 遍 厉 (fpreorder traversal). iX B. 当前 他 点 在 其 
儿子 节点 之 前 处 理 .， 这 种 遍历 可 以 用 来 利用 节点 深度 标志 仁 - UTR ue 





int 
Height( Tree T 5 
i 
1f€ 1 == NULL 3 
return 1; 
else 
return 1 + Maxi Height( T-»Left 3, 
| Height( T-»RKight > 3; 
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所 有 这 些 例 程 有 一 个 共有 有 的 想法 , ARE SE FE Rb NULL 的 情形 , ind a aR BY 1 
Wo 注意 , 此 好 缺 少 一 些 额 外 的 变量 。 这 些 例 程 仅仅 传递 了 树 ， 并 没有 玛 明 或 是 传递 什 们 向 
bE EFRA, 一 些 感 大 的 错误 出 现 的 可 能 就 越 小 、 第 四 种 避 历 用 得 很 少 . ULLA 
JPR J (level-order traversal}, 我 们 以 前 尚 林 见 到 过 ， 在 屋 BAY, WERE D Ae 
在 深度 D1 1 ARATE. RF GRR S TELE 877 fe Pe EENH 
地 实施 的 ; CASAS. AN BT ras HK 
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Bue ^os IESRTIL EE SE WARREN le 3X 
树 LCR nd X B-BI(D-tree) a 

阶 为 M 的 B- 树 是 一 棵 具有 下 列 结 移 特 性 的 树 ， 

。 树 的 根 或 者 是 一 - 片 树叶 , 或 者 其 儿子 数 在 2 和 M Zij 

。 除根 外 ,所 有 非 树 叶 节 点 的 儿子 数 在 ' M /2 | 和 M 之 闻 。 

。 所 有 的 树叶 都 在 相同 的 深度 上 。 

所 有 的 数据 都 存储 在 树叶 上 .在 每 一 个 内 部 节点 上 篆 含 有 指向 该 节点 各 儿子 的 指针 Pj， 
Pay vias Py 904r HK RE FO PS, Ps, , Pay te HA EU VRE TAL RI. kos oe. 
ky jo 当然, 可 能 有 些 指针 古 NULL, 而 其 对 应 的 p 则 是 未 定义 的 ， 对 于 每 一 个 节点 ,其 
do Py) 中 所 有 的 关键 字 都 小 于 子 树 P; 的 关键 子 ， 如 此 等 等 。 树叶 包含 所 有 实际 数据 ， 这些 
数据 或 者 是 关键 字 木 身 , 或 者 是 指向 含有 这 些 关 键 了 的 记录 的 指针 为 使 例子 简单 ,我 们 将 
借 设 为 前 者 。B- 树 有 多 种 定义 ,这 些 定义 在 - - 些 次 变 的 细节 上 不 同 于 我 们 定义 的 结构 不过， 
RITE MAI BA A. (为 一 — fap 4 AY SS HY IE Se Re a PE, the 
pide aS E. peli TE ASRS FABRE ) 我 们 1 xk Cg TE (GE AD H 


12 
lis 图 4-58 中 的 树 基 4 阶 B 树 的 一 个 例子 。 


de plige 


i 叶 中 关键 字 的 个 数 也 在 | M /2 PRIM 之 间 。 
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4 Br B 树 更 流行 的 称呼 是 2-3-4 树 , 而 3 阶 B- 树 叫做 2-3 树 。 我 们 将 通过 2-3 树 的 特殊 情 
形 来 描述 B 树 的 操作 。 现 在 从 下 面 的 2-3 树 开 始 。 





我 们 用 椭圆 画 出 内 部 节点 ( 非 树 叶 )， 每 个 节点 含有 两 个 数据 。 椭 网 中 的 短 模 线 表示 内 部 
节点 的 第 二 个 信息 , 它 表 明 该 节点 只 有 沽 个 儿子 。 树 叶 用 方 框 画 出 , 框 内 含有 关键 字 。 树 叶 
中 的 关键 字 是 有 序 的 。 为 了 执行 一 次 Find, 我 们 从 根 开始 并 根据 要 查找 的 关键 字 与 存储 在 节 
点 十 的 两 个 (很 可 能 是 一 个 ) 值 之 间 的 关系 确定 (最 多 ) 三 个 方向 中 的 一 个 方向 。 
为 了 对 尚未 见 过 的 关键 字 XX 执行 一 次 Insert, 我 们 首先 按照 执行 Find 的 步骤 进行 。 当 到 
大 一 片 树叶 时 , RRRA TAA X 的 正确 的 位 置 。 例 如 , 为 了 插 人 关键 字 为 18 的 节点 ,我 
[134] 们 可 以 就 把 它 加 到 一 片 树叶 上 而 不 破坏 2-3 树 的 性 质 。 插 人 结果 表示 在 下 列 图 中 。 





不 过 , dupbF--H Bin RE ES TIE OP ORE, DUC Ree a A eT HY, SA 
我 们 现在 试图 把 上 插 人 到 树 中 去 , 那么 不 会 发 现 1 所 属于 的 节 上 已 经 满 了 - 将 这 个 新 的 关键 
字 放 人 该 方 点 使 得 它 有 了 四 个 关键 字 , 这 是 不 允许 的 。 解决 的 办 法 是 , PARRA SA. BET 
PRAATKET, 同时 调整 它们 父 节 点 的 信息 , 3n PE]. 





ATN 
m ls Gus L | | , ——À 
11, 12 16, L7, 18! 22, 23, 31 | 41,52 | (58, 59.61 
-ua LY >] | MEN] 78, 59. 6 


然而 ,这 个 想法 也 不 总 能 够 行 得 通 , 我 们 尝试 将 19 插 和 到 当前 的 树 中 时 就 会 看 出 问题 。 
A ADEST TUR, 每 个 节点 有 两 个 关键 字 , WARME IR, 
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xc 68 — PRESS T FIAROL-T, SIRT ARIE EB STL FP. SERO 
很 简单 。 我 们 只 要 将 这 个 节点 分 成 黄 个 节点 ， MAMMA 当然 . 这 个 节点 本 号 
可 能 就 是 三 个 儿子 节点 之 一 , 而 这 样 分 型 该 入 点 将 给 它 的 父 节点 带 来 一 个 新 闻 题 (该 父 市 A 
PPT IL). 但 是 我 们 可 以 在 通 向 UB Bose fe LEL ovens BMRA ARTA, 
成 者 找到 一 个 节点 ， 这 个 节点 只 有 两 个 儿子。 在 我 们 的 例子 中 , 通过 用 分 裂 节 点 的 方法 我 们 
只 能 到 达 所 见 到 的 第 一 个 内 部 节点 ,得 到 如 下 的 树 。 





旭 打 现在 播 和 关键 字 为 28 的 一 个 元 素 , 那么 就 会 出 现 一 片上 由 有 四 个 儿子 的 树叶 ， urn 
Sy HH OE, SEIT PATIL 


100 HAE 





eS 58:27 
Ls asia 


这 样 ， 又 产生 一 个 具有 四 个 儿子 的 内 部 节点 ,此 时 它 被 分 成 两 个 儿子 节点 。 我 们 这 里 做 
[136] 的 就 是 把 根 节点 分 成 两 个 节点 。 这 个 时 候 , 我 们 得 到 一 个 特殊 情况 , 通过 创建 一 个 新 的 根 节 
点 我 们 可 以 阁 束 对 28 的 插 人 。 这 是 2-3 树 增加 高 度 的 ( 惟 一 ?方法 。 





(22, 23| [28,31 n. 52 ps. 59. 61! 


还 要 注意 ,当权 人 一 个 关键 字 的 时 候 ， 只 有 在 访问 路 径 上 的 那些 内 部 节点 才 有 可 能 发 生 
变化 。 这 些 变化 与 这 条 路 径 的 长 度 成 比例 ; 但 是 要 注意 , 由 于 需要 处 理 的 情况 相当 多 , 因此 
很 容易 发 生 错 误 。 

对 于 一 个 节点 的 儿子 太 多 的 情况 还 有 一 些 其 他 处 理 方法 ,而 我 们 刚才 描述 的 方法 八 幅 起 
最 简单 的 情况 。 当 试图 将 第 四 个 关键 字 洪 加 到 一 片 宕 叶 上 的 时 蛋 , 我 们 可 以 首先 查找 只 有 两 
个 关键 字 的 兄弟 , 而 不 是 把 这 个 节点 分 裂 感 两 个 。 例 如 , 为 把 TO 添 吉 到 上 面 的 树 中 , 我 们 可 
以 把 ss 挪 到 包含 有 41 和 52 的 树叶 中 , 再 把 70 与 59 061 放 到 一 起 , 并 调整 一 些 内 部 节操 
中 的 各 项 。 这 个 策略 也 可 以 用 到 内 部 节点 上 并 尽量 使 更 多 的 节点 具有 足够 的 关键 字 。 这 种 方 
法 使 得 例 程 的 编制 稍微 有 些 复杂 , 但 是 浪费 的 空间 较 少 。 

我 们 可 以 通过 查找 要 被 删除 的 关键 字 并 将 其 除去 而 完成 删除 操作 。 如 果 这 个 关键 字 是 一 个 
节点 仅 有 的 两 个 关键 字 中 的 一 个 , 那么 将 它 除去 后 就 只 剩 一 个 关键 字 了 。 此 时 我 们 可 以 通过 把 
这 个 节点 与 它 的 一 个 兄弟 合并 来 进行 调整 。 加 果 这 个 几 征 已 有 3 个 关键 字 , 那么 我 们 可 以 从 中 
取出 一 个 使 得 两 个 节点 各 有 两 个 关键 字 。 如 果 这 个 兄弟 只 有 两 个 关键 字 , 那么 我 们 就 将 这 两 个 
节点 合并 成 一 个 具有 3 个 关键 字 的 节点 。 现 在 这 个 节点 的 父亲 则 失去 一 个 儿子 ， 因此 我 们 还 须 
向 上 检查 家 到 顶部 。 如 果 根 节点 失去 了 它 的 第 二 个 儿子 ， 那么 这 个 根 也 变 删 除 ， 而 树 则 减少 于 
_ 层 。 当 我 们 合并 节点 的 时 候 , 我 们 必须 记 住 要 更 新 保存 在 这 些 内 部 节点 上 的 信息 。 


tz: 
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MF AR MBR, HA ARRE FOI. TE AYA AE ACE EE AT 
经 具有 M PRES OIE. 这 个 关键 字 使 得 该 节点 具有 M 1 1 PORES. 我 们 可 以 把 它 分 裂 
pA a. cef SUR CM! DZ2 d BL OM 4 1)72j 个 美 键 字 .由 于 :这 使 得 从 节点 多 出 一 
个 儿子 、 因 此 我 们 必须 检查 这 个 节点 是 否 可 被 父 节 点 接受 ， 则 采 父 六 点 已 经 具有 M PL, 
那么 这 个 父 节 点 就 要 被 分 裂 城 两 个 委 点 .我 们 重复 这 个 过 程 正 天 找到 -一 个 父 节 上 总 共有 少 于 
M 个 儿子 如果 我 们 分 戏 根 节点 , 那么 我 们 就 些 创 建 一 个 新 的 根 . 这 个 要 有 两 个 儿 于 ， 

B- 树 的 深 典 最 多 是 [ log yo N 1。 和 在 路 共 虐 的 每 个 节点 ,我 们 执行 Oog MWER T. fF 
虹 坟 确定 选择 哪个 分 二 (使 用 折 半 查找 ), (OLE Insert 和 Delete 可 能 需要 OVE LE BERE VÀ 
刺 该 节点 下 的 所 有 信息 ， 因此， 对 于 每 个 Insert Al Delete 运算 、 HI AS TÉ By is TIBERI AJ 
OOM logy N) = O(CM Aog M) log N). 不 过 -次 Find 只 花费 Otiog NATAL. geint. 
MZA, M 的 最 好 (合法 的 ) 选 择 是 M = 3 或 M - 4, ix 5 EIAS XX. ETS 
出 . 当 M4 再 增 大 时 插入 各 删除 的 时 间 就 会 增加 ， 如果 我 们 只 关心 主 存 的 速度 , HUS gs rS 
让 树 {如 5-9 BO ERR TE ADEST. 

B 树 实际 用 于 数据 库 系 统 , 在 那 虹 权 散 存储 在 物理 的 磁盘 上 而 不 是 主任 中 ;一般 说 来 ， 
对 态 稻 的 访问 要 比 任 何 的 主 存 操 作 慢 几 个 数 晨 级， 如 果 我 们 使 用 M Br BBY. AB AR i 
HEUS Ologu N)。 虽 然 每 次 磁盘 访问 化 费 O(log MI) 来 确定 分 支 的 方 站 , 但 是 执行 该 操作 
的 时 间 一 般 要 比 读 存 储 器 的 区 块 (block) 所 化 费 的 时 间 少 得 多 、 内 此 可 以 被 认为 是 无 忠 轻 里 的 
(Re M 选择 得 人 台 理 )。 即 使 在 每 个 节 忆 执行 更 新 此 花费 OC MPEP ETI, 这 些 人 花费 一 般 还 
EA. IEE M 的 值 选择 为 个 得 一 个 内 部 他 点 仍然 能 够 装 和 一 个 矿 瘟 区 块 的 最 大 值 ， 那么 
它 - - 般 说 来 是 在 325° M0256 范围 内 、 选择 存储 在 一 片 科 叶 上 的 元 束 的 最 大 个 数 时 ,更 俩 得 
如 果树 叶 是 满 的 那么 它 就 装 满 一 个 区 块 。 这 意味 着 ， 一 个 记录 总 可 以 在 很 少 的 磁 量 访问 小 被 
找到 ,因为 典型 的 B- 树 的 深度 只 有 2 或 3， 而 根 (很 可 能 述 有 第 ET ARE E N- 

分 析 指 出 , 一 棵 BRE NE In 2 = 69%. CH BEMEG SUI BS CM + 1) 项 时 , GE 
是 改 去 分 型 节点 ,而 是 搜索 能 够 接纳 新 儿子 的 兄弟 ,此 时 我 们 就 能 够 更 好 地 利用 空间 -其 体 
的 细节 可 以 在 参考 文献 中 找到 - 


总 结 


FeO LEEPER RSE. PERL A APPR PU. RAAR EE ET 
所 调 的 分 析 树 (parse trec) f— MAT, SHIT AUER PRIETO EUR. A 
LAY, Ti lie de CEDE AOE FECAL, 建 六 分 析 树 的 算法 却 不 是 那么 简单 )、 

舍 找 树 在 算法 设计 中 是 非常 重要 的 。 它 们 几乎 友 持 所 有 有 用 的 操作 ,而 其 对 数 平 均 开锁 
很 小 、 查 找 树 的 非 递归 实现 多 少 要 快 一 些 , 但 是 递归 实现 更 讲究 .更 精彩 . MES TEUER 
除 钙 ， 在 找 树 的 问题 在 于 ,共性 能 严重 地 依赖 十 输入 , 而 输入 则 基 随 机 的 。 如 困 情 沈 个 左 这 
样 , 则 运行 时 间 会 显著 增加 . eder coke RE 

我 们 见 到 了 处 理 这 个 问题 的 儿 个 方法 。AVL PEORIA WA TS PTE a E 
相差 最 多 是 1。 这 就 保证 了 树 不 至 于 太 深 。， 不 改变 树 的 操作 都 可 以 使 用 标准 二 又 查找 树 的 秦 
Hi 2 AR ht ES ED DECRE REL. CEP IERI, RA RT. REGE T TE k 
O(log N) 的 时 间 插 人 后 如 何 将 树 恢复. 


138, 
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我 们 还 考察 了 伸展 树 。 在 伸展 树 中 的 结 点 可 以 达到 任意 深度 , 但 是 在 每 次 访问 之 后 树 又 
以 多 少 有 些 神 秘 的 方式 被 调整 。 实 际 效果 是 , 任意 连续 M 次 操作 花费 口 (M log NOI, € 
与 平衡 树 花 费 的 时 间 相 同 。 

与 2- 路 树 或 二 丸 树 不 同 , B 树 是 平衡 M- 路 树 ， 它 能 很 好 地 匹配 磁盘 : 其 特殊 情形 是 2-3 
E, 它 是 实现 平衡 查找 树 的 男 一 种 证 用 方法 。 

在 实践 中 ， 所 有 平衡 树 方案 的 运行 时 间 都 不 如 简单 二 叉 查 找 树 省 时 ( 差 一 个 弟 数 因子 )， 
伯 这 一 般 说 米 是 可 以 接受 的 , 它 防 止 轻 易 得 到 最 坏 情 形 的 输入 。 第 12 THO AI EE 
树 数据 结构 并 给 出 详细 的 实现 方法 。 

BREE: 通过 将 一 些 元 察 插 和 人 到 查找 树 然 后 执行 一 次 中 序 遍 历 , 我 们 得 到 的 是 排 过 序 
的 元 素 。 这 给 出 排序 的 一 种 O(N log N) 算 法 , 如 果 使 用 任何 成 熟 的 查找 树 则 它 就 是 最 坏 铺 
形 的 界 。 我 们 将 在 第 7 章 看 到 一 些 更 好 的 方法 , 不 过 , 这 些 方 法 的 时 间 界 都 不 可 能 更 低 。 


练习 


问题 4.1 到 4.3 参考 图 4-59 中 的 树 . 
4.1 对 于 图 4-59 中 的 树 ， 
a. Br p EST 
b. Bpse s cce Bu rp? 
4.2 对 于 图 459 中 树 上 的 每 一 个 节点 : 
a. 指出 它 的 父 节 点 。 
b. WHENF TA. 
c. JI ERLE PS 
d. HARERRRE. 
e. 计算 它 的 商 度 。 
4.3 图 4-59 中 树 的 深度 是 多 少 ? 





Pe] 4-59 


4.4 证 明 在 N 个 节点 的 二 丸 树 中 , 存在 N + 1 个 NULL 指针 代表 六 + LUFT. 

4.5 证 明 在 高 度 为 日 的 二 叉 料 中 ,节点 的 最 大 个 数 是 27 01 1 

4 6 3% (full node) 是 具有 两 个 几 子 的 节点 。 证 明 满 节点 的 个 数 加 1 等 于 非 空 二 又 树 的 树 
叶 的 个 数 。 
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47 BOARA REN d. ... hy. Er PH OF BY BRE TE ER di. di. .... diro 证明 . 
NIV 24 < 4 并 确定 何 时 等 写成 六 。 
4.8 给 出 对 应 国 4-60 ASA RAGA US | SR Pea CV A aR ETAT 


o 
T ^ 
G iO 
- / 
Hog b cf d 


Mia-50 el 4.8 Ase 


4.9 a 指出 将 3, 1,4, 6,9, 2, 5, 7 特大 到 初始 为 空 的 一 叉 朝 找 树 中 的 统 林 . 
b. TE CHAIR ARG Ha AR 

4.10 好 出 实现 基 林 二 义 查找 树 操 作 的 葬 程 ， 

4.11 使 用 类 似 于 指针 链表 实现 法 的 策略 ,可 以 用 指针 实现 . 义 查 找 树 ”使 用 指针 实现 方 
法 写 出 基本 的 二 义 查 找 树 例 程 : 

4.12 PRR SESS OLE FA BEAL Insert/Delete 操作 对 可 能 引起 的 问题 。 这 里 有 AR, 
它 不 是 完全 随机 的 ,但 却 是 足够 封闭 的 。 通 过 插入 从 1 到 M= oN 之 加 随机 选 抽 的 NN 个 


TEKET- N 个 元 素 的 梧 。 然 后 执行 N? 对 先 插入 后 删除 的 灌 作 。 假 设 存在 例 “一 


fi RandomInteger(A,B).EiREI—ME A M B ZEER A BIKES LZ 
a. 解释 如 何 牛 成 在 1 和 邮 之 间 的 -- 个 随机 整数 ,该 整数 不 在 这 棵 树 上 (从 而 了 硕 机 捕 
人 可 以 进行 )， 用 N 和 a 来 表示 这 个 操作 的 运行 时 间 ， 
b ERRATA RUE 1M 之 间 的 一 个 随机 整数 ,该 整数 已 经 存在 于 这 梯 树 上 (从 
而 随机 删除 可 以 进行 )}。 这 个 操作 的 运行 时 间 基 多 少 ? 
c. a 的 最 佳 选 择 俏 是 多 少 ? 为 什么 ? 
413 编写 一 个 程序 , 赁 经 验 估计 删除 具有 两 个 子 节点 的 下 列 各 方法 : 
a. HOT, 中 最 大 节点 XX 来 代替 , 递归 地 删除 X 
b. 交替 地 用 Ty, 中 最 太 的 节点 以 及 Tr aen FP HEH RS AIRE 3 s 
c. eis. T,， 中 最大 的 节点 或 -Tk PRAAT ARRE OR IE D A Rak ST 
As ， 哪 种 六 法 给 出 最 好 的 平衡" sh Ais mae UATE FE List Fe ETE R a 
RR 
4.14. 证 明 , BAL RT ROE CRE 0 8 LESER BEES] D. O (log. N): 
24.15 a. ubi EO H M AVL BIBS Vio ideo TCR ACA - 
b. EX 15 的 AVL 树 中 季 点 的 最 少 个 数 是 多 少 ? 
4.)6 onion 4, 5,9, 3, 6, 7 插入 到 初始 空 AVL REMAR 
.4 .17 沪 次 将 关键 字 1. 2,..., 25 - LR ASI PREIS AVL m HESH Br 48 Bl ES p E 
完全 平衡 的 : 


ee £a 


4.18 写 出 实现 AVL 单 旋转 和 双 旋 转 的 其 余 的 过 程 。 

4.19 HAA AVL BESETTAR A ASE SE V AR 

«4.20 ”如 何 能 够 在 AVL 树 中 实现 ( 非 懒 信 删除? 

4.21 a. 为 了 存储 一 棵 NN 节点 的 AVL 树 中 一 个 节点 的 高 度 , 每 个 节点 需要 多 少 比 特 (bit)? 
b. 使 8 比特 高 度 计 数 器 洪 出 的 最 小 AVL 树 是 什么 ? 

4.22 ” 写 出 执行 双 旋 转 的 函数 ,其 效率 要 超过 执行 两 个 单 旋 转 . 

4.23 指出 依 序 访问 图 4-61 中 的 伸展 树 中 的 关键 字 3, 9, 1, 5 后 的 结果 。 





图 4-61 


4.04 ”指出 在 前 一 道 练习 所 得 到 的 伸展 树 中 删除 具有 关键 字 6 MUR aa. 
4.25 由 节点 1 直到 N = 1024 BR —BR EU ZEJL- EJ FE S o 
a. 该 树 的 肉 部 路 径 的 长 准确 地 说 是 多 少 ? 
«b. 在 执行 Find(1), Find(2), Find(3), Find(4), Find(5), Find(6) 每 一 个 之 后 计算 
肉 部 路 径 长 。 
cc 如果 相 继 执 行 的 Find 是 连续 的 , 那么 什么 时 候 内 部 路 径 长 达到 最 小 ? 
4.26 a. 证明, 如果 在 一 棵 伸展 树 中 按照 顺序 访问 所 有 的 节点 , 那么 所 得 到 的 结果 是 由 一 
ERA ILS AMAT. 
wb. 证 明 ,如果 在 一 棵 伸展 树 中 按 顺 序 访问 所 有 的 节点 ,那么 若 不 考虑 初始 树 ， 则 总 
的 访问 时 间 是 O(N)。 
427 ”编写 一 个 程序 对 伸展 树 执行 随机 操作 。 计 算 对 序列 执行 的 总 的 旋转 次 数 。 3 AVL 
树 和 非 平 衡 二 叉 查 找 树 相 比 ， 共 运行 时 间 如 何 ? 
4.28 ”编写 一 些 高 效率 的 函数 ,只 使 用 指向 二 叉 树 的 根 的 一 个 指针 T, 并 计算 : 
a. 工 中 节点 的 个 数 。 
b. T 中 树叶 的 片 数 - 
c,， 工 中 满 节点 的 个 数 。 
4.29 写 出 生成 一 棵 N 节点 随机 二 又 查找 树 的 函数 , 该 树 具有 从 1 直到 N 的 不 同 的 关键 
字 。 你 所 编写 的 例 程 的 运行 时 间 是 多 少 ? 
4.30 宇 出 生成 具有 最 少 节点 、 高 度 为 H 的 AVL 树 的 程序 , 该 函数 的 运行 时 间 是 多 少 ” 
| aai 编写 一 个 函数 , 使 它 生成 -- 棵 具有 关键 字 从 LEA 2- 1AA H 的 理想 平衡 
142| ZILARRA WowwGaefr Bee? 


4.32. 编写 一 个 函数 以 . XLI TOR REIS EET k M klk EBD YE WRIA, dT 


1 


I 


p 


b b È 


f 105 


印 树 中 所 有 满足 BIELKey(X)snk. BTA Xe 除去 可 以 排序 证. 不 对 关键 字 的 类 型 
做 任何 息 设 。 所 全 的 程序 应 该 以 平 区 时 间 OLK + dog NJ 运行, 其 中 KK 是 所 打印 
的 关键 字 的 个 数 ， 确 定 你 的 算法 的 运行 时 间 界 . 


33 本章 直 一 些 更 大 的 - ATR: PREP Oo, RT Le ae 


指定 坐标 (rz，v)， 围 绕 每 个 坐标 画 一 个 圆 痢 ( 在 某 些 网 片 中 这 可 能 很 难看 清 )}， 并 将 

AP PARENTAL. REETA RA AE RAR RITA LA 

a5 — SEE HE n 85 ER Bg TI SS FEB EER o 

a. 坐标 x ADRS PRR BORE. 3-H PRE BL 

b. rR 可 以 通过 使 用 节点 深度 的 相反 数 算 出 。 对 于 树 中 的 每 :个 节点 写 出 这 样 的 
例 程 。 

c. 若 剑 用 其 个 虚拟 的 单位 表示 , 则 所 务 图 形 的 具体 尺寸 是 多 少 ” 如 何 调 稚 单 位 使 得 
所 曙 的 树 总 是 高 大 约 为 澳 的 三 分 之 二 ? 

d. WEB, 使 用 这 个 系统 没有 交 交 线 出 现 , ad, 对 于 生意 节点 X. X 的 左 子 树 的 所 
有 元 素 部 出 现在 X 的 左边 ，X 的 丰 了 于 树 的 所 有 元 素 都 囊 现 在 义 E. 


,34 编写 -个 一 般 的 画 树 程序 , 该 程序 将 把 一 棵 树 转变 成 下 列 的 图 -组 次 折 令 : 


a, Cirdle( X, Y) 

b. DrawLine(i. j) 

t9. ARSTE, YOMRbIBI— TA, 而 第 二 个 指令 则 连接 第 i 个 圆 和 第 j 个 圆 ( 圆 以 

所 画 的 顺 译 编号 )。 你 或 者 把 它 汪 成 一 个 程序 并 定义 某 种 输入 语言 ,或 者 把 它 马 成 
.个 函数 ,该 函数 可 以 被 什 何 程序 调用 : 你 的 程序 的 运行 时 间 是 多 少 ? 


35 编写 一 个 例 程 以 层 序 {level-order) 列 出 二 叉 树 的 节点 : 先 列 出 根 ， 然 后 列 出 深度 为 1 


的 那些 节点 , 再 列 出 深度 为 2 的 节点 , 等 等 。 必 须要 在 线性 时 间 内 完成 这 个 工作 。 
TEAR REDIERE Tal FF. 


.36 a. 指 站 将 下 列 闫 键 字 插入 到 初始 空 2-3 树 后 的 结果 ; 3, 1, 4, 5, 9, 2, 6, 8, 7, 0. 


b. 指 电 在 Ca) 建立 的 2-3 树 中 删除 0, 然后 再 删除 9 所 得 到 的 结 


.37、a. EE RI — BR BASE AHA 


cb. BM REBAR IE, 26 — OR BSR, 是否 要 更 新 站 部 下 
点 的 信息 ? 

.修改 你 的 播 人 例 程 使 得 姐 果 想 要 向 一 个 已 经 有 M 项 的 节点 洪 加 元 紊 ， Wide 0E 
该 节点 以 前 要 执行 搜索 具有 少 于 M 个 儿子 的 兄弟 的 工作 。 


.38 MB B' BIO -trce) EH fi ABE 1r a JL Xe 2M 73 $0 M = aA BAY. $t 


Jh B" 树 进 行 插 人 的 方法 . 


39 ”指出 如 何 用 儿子 /兄弟 指针 实现 方法 表示 图 4-62 中 的 树 . 


.40 ”编写 -个 过 程 使 该 过 程 遍 访 一 株 用 儿 芋 7 兄弟 链 人 存储 的 桶 
Al 如果 两 棵 一 叉 树 或 者 都 是 空 树 ， 或 者 非 空 瑟 只有 相似 的 左 子 树 和 石子 俩 ， 则 这 两 标 
二 义 树 是 相似 的 。 编 写 一 个 函数 以 确定 是 否 两 棵 二 叉 树 是 相似 的 。 
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图 4-62 练习 4,39 中 的 树 


4.42 如 果树 Ti 通过 交换 其 ( 某 些 ) 节 点 的 左右 儿子 变换 成 树 T. Mee T, 和 了 是 同 
#449 (isomorphic), Bilal, 图 4-65 中 的 两 棵 椅 是 同 构 的 ,因为 交换 A. B. G 的 儿子 
而 不 交换 其 他 节点 的 儿子 后 这 两 棵 树 是 柜 同 的 。 
a. 给 由 一 个 多 项 式 时 间 算 法 以 决定 是 否 两 棵 树 是 同 构 的 。 
*b. 你 的 程序 的 运行 时 间 是 多 少 (存在 一 个 线性 的 解 奖 方案 吗 )5 





L144| 图 4-63 两 棵 同 梅 的 树 


4.43 «a. 证 明 , 经 过 一 些 AVL 单 旋转 , 任意 二 叉 查 找 树 工 | 可 以 变换 成 另 一 棵 (县 有 相 
ES EAR Too 
xb. 给 出 一 个 算法 平均 用 O(N log N) 次 旋转 完成 这 种 变换 。 
wx c， 证 明 该 变换 在 最 坏 的 情形 下 可 以 用 O(N) 次 旋转 完成 。 
4.44” 设 我 们 想 要 把 运算 FindKth 添加 到 指令 集中 去 。 沪 运算 FindKth(T, i) 返回 树 T 
的 具有 第 i 个 最 小 关键 字 的 元 案 。 假 设 所 有 的 元 察 具有 瑟 异 的 关键 字 。 解 释 如 何 修 
改 二 叉 树 以 平均 O(log N) 暑 间 支 持 这 种 运算 ， 而 又 不 影响 任何 其 他 操作 的 时 间 界 。 
4.45 由 于 具有 N 个 节点 的 二 叉 查 找 树 有 NN + 1 个 NULL 指针 , 因此 在 二 叉 查找 树 中 指 
定 给 指针 信息 的 空间 的 一 半 被 浪费 了 。 设 若 一 个 节点 有 一 个 NULL 左 儿 子 ， 我 们 
EERE JLT EE MPATE (inorder predecessor), 车 一 个 节点 有 一 个 NULLA 
儿子 , 我 们 让 它 的 右 儿 子 指向 它 的 中 组 后 继 (inorder successor)» 这 就 叫做 线索 对 
(threaded tree), Te RA BUSS Et RU Ae A (thread) a 
a， 我们 如 何 能 够 从 实际 的 儿子 指针 中 区 分 出 线索 ? 
b. 编写 执行 向 由 上 面 描述 的 方式 形成 的 线索 树 进行 持 人 和 删除 的 俩 程 。 
c. 使 用 线索 树 的 优点 是 什么 ? 
4 46 二 又 查找 树 预先 假设 搜索 是 基于 每 个 记录 只 有 一 个 关键 字 。 设 我 们 想 要 能 够 执行 或 
者 基于 关键 字 Key 或 者 基于 关键 字 Keyz 的 查找 。 
上， 一 种 方法 旦 建立 两 棵 分 离 的 二 又 树 。 这 需要 多 少 额 外 的 指针 ? 
b. 另 一 种 方法 是 使 用 2-d 树 。2-d 树 类 似 于 二 叉 树 ， 其 不 同 之 处 在 于 , TETUER 
Kev, XAL, 而 在 奇数 层 用 Kev xe 47M, Kd 4-64 显示 一 棵 2-d BS, 以 名 (first 
name) AIRE (last name) 作为 美 键 字 对 第 二 次 世界 大 战 后 的 美国 总 统 进行 查找 。 
总 统 的 姓名 是 按照 年 代 顺 序 插 和 人 的 (杜鲁门 ， TARRAK, BG, Aww, JE 
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AS, 福特 , 卡特 , 里 根 , 布什 , 充 休 顿 }， 编 与 一 个 加 一 樟 2-4 树 进行 插入 的 例 程 。 
ec. 编写 一 个 商 效 的 过 程 PST ED LR Loug si Kev, € High, W Low, 
zz Keys High IPIS (8] BR A LLL 
d. 指出 如 何 扩充 2-4 树 以 处 理 和 多 于 两 个 的 搜索 关键 宁 : MSA SHIT i k-d P 


wign Etsenhower * ^ junn Kennedy 


"n -全 -77 ut 00m e f nmn 
H 5, ki ` 
M _--—-- lu ens PL, Ks 
C George Bash Gerald Fard nen Johnson ， Re haid Nixon 
—— é — 一 = 一 = 一 -一 — - 
f 
PA ’ E 
-一 一 ~- D —— f — _ = 一 -= 

“Ril Clinton ~ denny Canes ~ ' Road Reagan ^ 
"m m S E SENE 


图 464+ -fR2-d BH 
25 75 X. RÀ 


美玉 一 又 树 的 更 多 的 信息 ， 特 别 足 树 的 数学 性 质 扣 以 在 Knuth, 23] 积 [24] 的 两 本 书 中 找 全 . 
Ay TUES Sc Rg LX £r ERE RESCUE Dod RES biased deletion) 算 法 引起 的 平 衡 不 足 问 题 ， 
Hibbard 的 论文 -20] 提 出 原始 删除 算法 并 确 站 了 -次 删除 保持 桂 的 随机 性 .文献 .21] 各 5， 
分 别 对 只 有 三 个 市 点 的 树 和 四 个 节点 的 树 进 行 了 全 面 的 分 林 。Fppitleer A ie 3c 15 TE T AE 
随机 性 的 早期 经 验 性 的 证 据 . 而 Culberson 种 Munro 的 论文 -41 各 1121 则 提供 了 蘑 些 解析 论 
证 { 但 不 是 对 混 茶 揪 人 和 期 除 的 一 般 情形 的 元 党 证 明 ). 

AVL BTH Adclson- Velskii 和 Landis; 1 424). AVL MH BATRA RM AVL BE BE 
ALAS UES BTR AR ee 22; Pape. AVL BEAD IBIERTE HE A MÆ FR Bh - 
ft AVL R PERR AF HME Ase, 但 起 . 25 RRR ER 

AR 3 AU 9 | BIBT EAR B 4.5.1 5258 mg AE 伸展 树 在 [29 qi Td. 

AL cdd op p. JAS OCF ATR VRAT SERE A TREE TE IN BB 15 cx OLBE I i 

在 :树叶 上 ， 我 们 描述 过 的 数据 结构 有 时 叫做 B^ b. OER BRT Tea or re 
8 :报告 了 各 种 方案 的 经 验 性 结果 .23 桂香 了 树 的 分 机 可 以 在 !4 . . L14 EL [33 ] PE I. 
练习 4.14 使 人 误 以 为 很 蕉 。 一 种 解法 可 以 在 16] 中 找到 练习 4.26 RA 32]. 在 练习 
4.38 PARERI B - 树 的 信息 可 以 在 -13 THAR Bl. 853] 4.42 RR XC 2]. HAY 4.43 EGET] 
IN 6 次 旋转 ,解法 在 |30] 中 给 出 、 练 习 4.45 中 使 用 的 线索 首先 在 [28 中 提出 。 k-d REB 
最 早 提 出 是 在 [7] 中 , ESR EF AE GEHEN, SCAR 8 LTTE T kd 树 以 及 其 他 
_. 些 用 于 多 维 搜索 的 方法 ; 本 书 第 12 章 也 进行 了 简要 的 讨论 。 

另外 一 些 流 行 的 平衡 查找 树 是 红 黑 树 - 19] 利 威权 平衡 树 27]。 在 第 12 mn] 可 以 找到 出 多 

的 平衡 树 方案 , 此 外 进 可 以 在 著作 7171、:26! 以 及 .31| 中 找 氏 ， 
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RIAR 4 Ehe ERR ADT、 它 共 许 对 一 组 元 素 进 行 各 种 操作 ， 本章 讨 论 数 列表 
(hash tabteyATDT， 不 过 它 只 支持 一 又 查找 树 所 允许 的 一 部 分 操作 . 

A PASAT SCHL AS A  Chashing) BOWE 种 用 于 以 常数 平均 时 间 执 行 插入 、 删 除 
利 碍 找 的 技术 . EE. 那些 需要 元 素 问 任何 排序 信和 总 的 操作 将 不 会 得 天 有 效 的 支持 . 因此， 
jfi 4l FindMin, FindMax 以 及 以 线性 时 间 将 排 过 序 的 束 个 表 进 行 打印 的 操作 都 是 向 列 所 不 支 
FFAN., 

本 至 的 中 心 数据 结构 是 散 列 表 , 我 们 将 

© AHULARI RELE nk. 

。 分 析 比 较 这 些 方法 ， 

。 介绍 藤 列 的 多 种 应 几 ， 

。 将 散 列 表 和 一 义 查 找 树 进 行 比 较 。 
5.1 一 般 想 法 

理想 的 藤 列 点 数据 结 梅 上 共 不 过 是 一 个 包 洁 有 关键 字 的 具有 轩 定 大 小 的 数组 。 些 型 情况 
下 . 一 个 关键 字 就 是 一 个 带 有 相关 值 { 例 如 工资 信息 } 的 字符 串 . 我 们 把 表 的 天 小 记 作 Tabie- 
Sixze,， 并 将 其 理解 为 散 列 数据 结构 的 一 部 分 而 不 仅仅 是 浮动 于 全 局 的 某 个 变量 , 通常 的 习惯 
M ERM O F) TadleSize -1 变化 ; 稍 后 我 们 就 会 明日 为 什么 此 这 样 。 

RE ORES E RM, O 到 TableSize 一 | 这 个 范围 中 的 茶 0 
个 数 , 并 且 被 放 到 和 运 当 的 单元 中 。 SN a ” |! 
(hash function) ,理想 情况 下 它 应 该 运算 简单 计 且 应 该 保证 任 和 — 7. 07 
两 个 不 同 的 关键 字 映射 到 不 同 的 单元 。 不 过 ,这 和 是 不可 能 的 , 因 0C me 
为 单元 的 数目 是 有 限 的 ， 而 关键 字 实 际 上 是 用 不 完 的 。 内 此 , 我 | 9 ———3À 
们 了 半 找 一 个 散 列 函 数 , 该 渭 数 要 在 单元 之 间 均 匀 地 分 配 关 键 子 ， ， 
图 5-] à 个 典型 的 理想 情况 ,在 这 个 例子 中 , john BYES, 7 
phil FIJE 4. dave RSIR G, mary 散人 列 到 7 8 

DERRY lo] SR A — T PREX, 9 
UEM PT ESE sS] — (8 8 mE fee CERCA 2p (collision) ) 
请 该 做 什么 以 及 如 何 确 定 散 列 表 的 大 小 。 


5.2 BEBE 

如 果 输 入 的 关键 字 是 整数 ， 则 - ROADER AIR" Key mod TableSize "lr 
Wb. 除非 Key 磁 巧 具有 某 些 不 理想 的 性 质 , 在 这 种 情况 下 ， BO SRI PE ETT PROS IS 
例如 ， 若 表 的 大 小 是 10 而 关键 字 都 以 0 为 个 位 , 则 此 时 上 述 标准 的 散 列 晃 数 就 是 一 个 不 好 的 
选择 。 此 原因 我 们 将 在 后 面 看 和 到, mic jew Fm HEBEL. 杂 的 办 法 遂 常 是 保证 表 的 大 
小 是 素数 。 当 输入 的 关键 宁 是 随机 整数 时 ， 艇 列 函数 不 仅 算 起 来 简单 而 且 关 键 宁 的 分 配 也 很 


$n 
| dave 275] i 
— 一 
| mary 28200 
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图 5 1] -CARP E 
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AV 


I, REF EPA ; 在 这 种 情形 下 , WRR E ET A AT 
AUR TK RIS AS PAH ASCH 码 值 加 起 来 。 在 图 5-2 rp, 我们 声明 类 型 
lndex， 它 是 散 列 函数 的 返回 值 类 型 . 网 5-3 SORIA ARATE ALY C Zr EEE TU 


加 来 处 理 整 个 字符 操 。 


图 5-2 H RES pR RGE E] RI 


Index 
Hash( const char *Key, int TableSize ) 
{ 


unsigned int HashVal = 0; 


while( *Key != "\G' } 
HashVal += *Key++; 


return Hashval % TableSize; 





图 5-3 -个 简单 的 散 列 函数 


图 5.3 中 描述 的 散 列 函数 实现 起 来 简单 而 且 能 够 很 快 地 算出 答案 。 不 过 ,如果 表 很 大 ， 
则 函数 将 下 会 很 好 地 分 部 关键 宁 。 例 如 , 设 TableSize = 10007(10 007 是 素数 ), 并 设 所 有 的 
关键 字 至 多 8 个 字符 长 。 出 于 cher 型 量 的 值 最 多 是 127, 因此 散 列 函数 只 能 假设 值 在 0 和 
1016 之 间 , 其 中 1016= 127X8。 显然 这 不 是 一 种 均匀 的 分 配 ， 

吕 一 个 散 列 函数 由 图 5-4 表示 。 这 个 散 列 通 数 假设 Key 至 少 有 两 个 字符 外 加 NULL 结束 
符 . 值 27 表示 英文 字母 表 的 字母 个 数 外 加 一 个 空格 , 而 729 = 27 。 该 函数 只 考查 前 三 个 字 
符 , 但 是 , 很 如 它们 是 随机 的 ,而 表 的 大 小 像 前 面 那样 还 是 10007, 那么 我 们 就 会 得 到 -一 个 合 
理 的 均衡 分 配 。 可 是 不 石 的 是 , 英文 不 是 随机 的 。 虽然 3 个 字符 (忽略 空格 ) 有 26°= 17576 
种 可 能 的 组 合 , 但 查验 词汇 量 足 够 大 的 联机 词典 却 揭示 ; 3 个 字母 的 不 同 组 侣 数 实 际 只 有 
2 851。 即 使 这 些 组 侣 没有 冲 罕 , 也 不 过 只 有 表 的 28% RAT BONS), 因此, 虽然 很 容易 计 
算 , 但 是 当 散 列表 足够 大 的 时 候 这 个 函数 还 是 不 合 运 的 。 


Index 
| Hash( const char *Key, int TableSize 3 
1 


return ( Key[ 0 ] + 27 * Key[ 1 ] + 729 * Key[ 2 ] ) 
X TableSize; 










疼 5-4 “ 另 一 种 可 能 的 散 列 函数 一 一 个 太 好 


图 5-5 刚 出 了 散 列 函数 的 第 3 种 尝试 。 这 个 散 列 函数 涉及 到 关键 字 中 的 所 有 字符 , TFA 
_ 般 可 以 分 布 得 很 好 ( 它 计算 DO Keyl KeySize — i = 11132’, 并 将 结果 限制 在 运 当 的 
范围 内 )。 程序 根据 Horner 法 则 计算 一个 (32 的 ?多 项 式 函 数 。 例 如 ,计算 h= kit 27k. + 
2 k4 的 另 一 种 方式 是 异 助 于 公式 A = (Cka) X 27 + ka) X 27 + by 进行 。 Horner 法 则 将 





i Index | 
Hashf const char *Key, int TableSize ) 


unsigned int HashVal = D 


fe e while( *Key := 'NQ' 3 
| EFL HashVal — C HashVal «e 5 3 + *Keyeast 
| fu ge return Hashval % TableSize; 


我 们 之 所 以 用 32 代替 27, 是 因为 用 32 MESE AERIS, mede gem). 
为 了 加 还 ,在 程序 第 2 行 的 加 法 可 以 用 按 位 异 或 来 代 答 . 

l 5-5 所 描述 的 散 列 育 数 鳄 表 的 分 布 向 旧 未 必 十 菩 好 的 ,但 是 确实 具有 极其 简单 的 优点 
CRUSE FOU EM. 那么 速度 也 很 快 ). 如 果 关键 字 特 别 长 . FS ZR OR RE A ACH oe LE 
过 多 的 时 间 ， 不仅 如 此 ,前 面 的 字符 还 会 三 移出 最 终 的 结果 在 这 种 情况 下 , 通常 的 做 法 是 
不 合用 所 有 的 字符 。 此 时 关键 字 的 长 度 和 性 质 将 影响 选择 - 例如 , 关键 字 可 能 类 完整 的 街道 
地 址 ,向 列 员 数 可 以 包括 街道 地 址 的 儿 个 字符 ,也 许 是 城市 和 名 和 旦 政 区 码 的 儿 个 字符 ,有些 
TEH 人员 通过 只 使 用 奇数 位 置 二 的 溯 符 来 实现 他 们 的 散 列 是 数 ,这 里 有 这 人 么 一 层 想 法 : 
用 计算 散记 本 数 节省 下 的 时 间 来 补偿 由 此 产 牛 的 对 列 匀 地 分 布 的 函数 的 轻微 干扰 ， 

剩 下 的 主要 编程 细节 是 解决 冲突 的 消除 问题 . WE PTR Ah POL RU 
fF te Cod fü RD, HBA BEER. 这 个 冲突 需要 消除 。 解 决 这 种 冲 帘 的 方法 有 几 种 ， 
我 们 将 讨论 其 中 最 简单 的 两 种 : 分 离 链接 法 和 开放 定 址 法 - 

5.3 分 离 链 接 法 

解决 冲突 的 第 一 种 方法 通常 叫 敌 分 离 链 接 法 (separate of Jit oT, 
chaining). 其 做 法 足 将 艇 列 色 同一 个 值 的 所 有 元 素 保留 到 -个 I| TIPE 
表 中 .为 方便 起 见 , BURMA BR, AL, 表 的 实现 与 第 3 LOT 
章 中 的 实现 方法 相同 。 如 果 空 间 很 紧 , TE AW ”4 EF 
Gee do. 本 节 我 们 假设 关键 字 是 前 10 个 完全 平方 数 并 SEO [RR 


iti He 4 PRR LE Hash (X) = X mod 10. CA Kv IE XC SL poH segs 


用 在 这 里 是 为 了 简单 ) 图 5-6 做 出 更 清晰 的 解释 : 一 中 
为 执行 Find, 我 们 使 用 散 列 函数 来 确定 完 竟 专 察 哪 个 表 . | ao, 


He FRAT EA BE 89 45 X D CER Led PETERE BY A OUR TE 
Br. ALT Insert, FR CL UI PORE BE PK RR aE 
As ER fici SIEA MA JU, HE A a PIR, PRT 
SEM RTE! 1), d REP TUAE RET CR. Hi a tod aie A BLA RD. 或 者 被 搬入 到 
ASHORE. MARRARA. Maa EEF THE c e TD EI — FR 有 时 新 元 率 插 
ARI eB Bi E A DLP Te E, 而 且 还 因为 新 近 插 入 的 元 素 最 有 可 能 最 先 锌 访问。 

完 现 分 离 链接 法 所 需要 的 类 型 声明 在 网 5-7 PRH, 图 中 的 ListNode 结构 与 第 3 章 中 的 


[] 5.6 ”分离 链接 艇 列表 


[14 


— M — — a 





Be SN BSE 
链表 声明 相同 。 图 中 的 散 列 表 结 构 包 括 --- 个 链表 数组 (以 及 数组 中 的 链表 的 个 数 ), 它们 在 散 
列表 结构 初始 化 时 动态 分 配 空间 。 此 处 的 HashTable 类 型 就 是 指向 该 结构 的 指针 类 击 。 






#ifndef | HashSep..H 
struct ListNade; 
typedef struct ListNode *Position; 


struct HashTh1; 
typedef struct Hashibl *HashTable; 


void DestroyTable( HashTable H }; 

Position Find ETementType Key, HashTable H 3; 

void Insert( Elementlype Key, HashTable H 3; 
ETementType Retrieve( Position P 3; 

/* Routines such as Delete and MakeEmpty are omitted */ 


sendif /* HashSep H */ 


/* Place in the implementation file */ 
struct ListNode 


ÉlementType Element; 
Pasition Next; 


[ 

HashTable InitializeTable( int TableSize j; 
| 

1 

}; 

typedef Position List; 


/* List *TheList will be an array of lists, allocated later * 
/* The lists use headers (for simplicity), */ 
/* though this wastes space */ 
struct HashTbl 

int TableSize;: 

List *Thelists; 
hi 


T 一 wn — 


图 5-7. 分 离 链接 散 列表 的 类 型 声明 


注意 ，TheList 域 实际 上 是 一 个 指向 指向 ListNode 结构 的 指针 的 指针 。 如 果 不 使 用 这 些 
tvpedef, 那 可 能 会 相当 混乱 。 

图 5.8 列 出 初始 化 函数 , 它 用 到 与 栈 的 数组 实现 中 相同 的 想法 。 第 4 行 到 第 6 行 给 一 个 
散 列 表 结 构 分 配 空 间 。 如 果 空 间 允 许 , 则 机 将 指向 一 个 结构 , 该 结构 包含 一 个 整数 和 指 网 一 
Meet, 第 7 行 设置 表 的 大 小 为 一 素数 , 而 第 8 行 到 第 10 行 则 试图 指定 List 的 一 个 数 
组 ,由 于 List 被 定义 为 一 个 指针 ,因此 结果 为 指针 的 数组 。 

自如 List 的 实现 不 用 表 头 , 那么 我 们 就 可 以 到 此 为 止 了 。 但 是 我 们 使 用 THA, 因此 必 
Fis BABE APRA IEEE Next BE NULL. 这 由 第 11 到 第 15 行 实现 。 当然 , 第 
12 行 到 第 15 行 可 以 用 语句 

H —  TheLists| i ] = MakeEmpty(}; 

(Ree, BARR RAE RABY, 但 是 因为 该 例 中 它 胜 过 使 程序 尽 可 能 日 包含 , 所 以 
它 当然 值 得 考虑 。 我 们 程序 的 - -个 低 效 之 处 在 于 第 12 行 上 的 malloc 执行 了 H -> Tableise 
次。 这 可 以 通过 在 循环 出 现 之 前 调用 一 次 malloc 操作 


H- > TheLists = malloc {H — > TableSize * sizeof (struct ListNode)); 
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InttializeTable( int TableSize ) 
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/*10*/ 


/*11*/ 


sees) 
/*13*/ 
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/*15*/ 


/*16*/ 


HashTable H: 
int 1]; 


iti TableSize < MinTableSize ) 


Error( "Table size too small" 3; 
return NULL; 


} 


H = matloc( sizeof( struct HashTbl ) 2; 
iff H == NULL } 
FatalError( “Out of space!!!" J}; 


H->TableSize = NextPrimac Table5ize }; 


/* Allocate table */ 

/* Allocate array of lists */ 

H-»TheLists = malloc( sizeof( List ) * H->TableSize 3; 

ift H-»Thel ists == NULL } ! 
Fata Error( "Out of space!!!" 5; | 


/* Allocate list headers */ 


Fort $ = 0; i < H-»Tablesize; i++ ) 
1 
H-»Thelists[ i ] = malloc( sizeof( struct ListNode ) 3; 
ft H-»Thelists[ i ) == NULL 2 
FatalError( “Out of space!!!" 9; 
else 
H-»TheLists[ i ]-»Next = NULL; 
} 
| return H; 


图 5-8 ”分 离 链 接 散 剂 表 的 初始 化 例 程 


(RARE 12 行 来 避免 . 第 16 行 返回 H, 

对 Find( Kev， 吾 ) 的 调用 将 返回 一 个 指针 ，| 该 指针 指向 包含 Key 的 那个 单元 、 SERRE EO 
程序 在 图 59 PIE. 注意 , 第 2 行 到 第 5 行 等 同 于 第 3 章 中 给 出 的 执行 Find 的 程序 。 因 此 ， 
第 3 章 中 表示 ADT 的 实现 方法 可 以 用 到 这 里 。 记 住 ， 如 果 ElementType 是 一 个 字符 串 ， 那么 


比较 种 赋值 必须 相应 地 使 用 stremp 和 strepy 来 进行 。 


| fe at/ 


/* 2"/ 
/* 3*/ 





Position 
Findt ElementType Key, HashTable H j 


i 


Position P; 
List L; 
L = H-»Thetists[ Hash( Key, H->TableStze ) ]; 
F = L->Next; 
while( P l= NULL && P->Elament l= Key à 
/* Probably need strcomp!! */ 


| od 


y* 4*/ P = P--Hext; 
fe ue return P; 
1 


图 5-9 分 离 连 接 散 列表 的 Find HE 
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下 一 个 是 插入 例 程 。 如 果 要 插入 的 项 已 经 存在 , 那么 我 们 就 什么 也 不 做; 否则 我 们 把 它 
放 到 表 的 前 端 ( 见 图 5-10)。? 该 元 素 可 以 放 存 表 的 任何 地 方 ; 此 处 这 样 做 是 最 方便 的 。 注意 ， 
搬入 到 表 的 前 端的 程序 基本 上 等 同 于 第 3 意 中 使 用 链表 实现 Push 的 程序 ， 如 采 第 3 章 中 的 
那些 ADT 都 已 经 仔细 地 实现 了 , BACH aT ANAM. 


void 
Insert ElamentType Key, HashTabie H 2 
{ 


Position Pos, NewCell; 
List L; 


Pos = Find( Key, H 3; 
it Pos == HULL ) /* Key is not found */ 
Newel] = malloc( sizeof( struct ListNode ] 3; 
ift NewleTl == NULL 3 
Fatalérror( "Out of space!!!" 5; 
else 


L = H-»Thelists[ Hasht Key, H-»TableSize ) ]; 
MewCell--Mext = L-»Next; 

MewCell-»Element = Key: /* Probably need strcpy! */ 
L >Next = MewCell; 





图 5.10 分 岛 链 接 散 麟 表 的 Insert FFE 


图 5.10 中 的 搬 人 例 程 写 得 多 少 有 些 不 好 ,因为 它 计 算 了 两 次 散 列 天 数 。 才 余 的 计算 总 是 
不 好 的 , 因此 , 如 果 这 些 散 列 例 程 真 的 梅 成 程序 运行 时 间 的 重要 部 分 ， 那么 这 个 程序 就 应 该 
152) WE, 
156 AN BS ELL e cb ER BES, ARTA ee BE. 如 果 在 散 列 的 诸 例 
程 中 椒 包 括 删 除 操作 , 那么 最 好 不 要 使 用 表 头 ， 因为 使 用 表 头 不 仅 不 能 简化 问题 而 且 太 要 浪 
费 大 量 的 空间 。 我 们 也 把 它 作为 一 道 练 避 留 给 读者 。 
除 链表 外 , 任何 的 方案 都 有 可 能 用 来 解决 冲突 现象 ， 一 棵 二 丸 查 找 树 甚至 另外 一 个 散 列 
表 均 可 胜任 , 但 是 我 们 期 望 如 果 表 大 , 同时 散 列 函数 好 , 那么 所 有 的 表 就 应 该 短 ， 这 样 就 不 
至 于 进行 任何 复杂 的 尝试 1 o 
我 们 定义 散 列 表 的 装填 因子 (load factor ) A 为 散 列 表 中 的 元 素 个 数 与 散 列表 大 小 的 比 但 。 
在 上 面 的 例子 中 , A = 1.0。 表 (list) 的 平均 长 度 为 和 。 执行 一 次 查找 所 需要 的 工作 是 计算 散 
列 函 数值 所 需要 的 常数 时 间 加 上 遍历 表 {list) 所 用 的 时 间 ， 在 一 次 不 成 功 的 查找 中 , 3 mas 
接 数 平均 为 4{ 不 包括 最 后 的 NULL 链接 )。 成 功 的 查找 则 需要 遍历 大 约 1 + (A /2) ERR: 
它 保证 必然 会 侦 历 一 个 链接 {因为 查找 是 成 功 的 )， 而 我 们 也 期 望 党 着 一 个 才 (list) 中 途 就 能 
找到 匹配 的 元 素 。 这 就 指出 ， 表 的 大 小 实际 上 并 不 重要 ， 而 装填 因子 才 是 重要 的 。 分 离 连 接 
Evi] 的 一 般 法 则 是 使 得 表 的 大 小 尽量 与 预料 的 元 素 个 数 差 不 多 ( 换 句 话说 ， 让 Ast). 正如 前 
mes, 使 表 的 天 小 是 素数 以 保证 一 个 好 的 分 布 ， 这 也 是 一 个 好 的 息 法 。 


己 ” 由 于 图 5.6 中 的 表 是 通过 插入 到 表 的 末端 建立 的 , 因此 图 5-10 中 的 程序 特产 生 一 个 将 图 5-6 HB de fi P td 2E BS AE 
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5.4 开放 定 址 法 


分 离 链 接 散 列 算法 的 缺点 旺 计 要 指针 ,由 于 给 新 单元 分 配 地 址 需 归 时 间 ,， 因 此 这 束 疆 竹 
答 法 的 速度 多 少 有 些 减 民 ， 辣 时 算法 实际 上 还 要求 对 另 PRR AAS COL. 除 使 用 链表 解 
peas}, JTGÁACE ALE P&C Open addressing hashing aSr PFA Ee BR PSR aA TE 
RCE AIRE RSP, Epod... LE ATE PTT. DORNER S B 
单元 为 止 Ah, 单元 hy XO. Ay (XM), A2 0(X), BS, Mami, Hn AX) = 
(Hash X) + Fi) mod TahleSize. H F(0) = 0. BAR P EE TR EAE. 因为 所 有 的 数 
HERE R ABA, SOF EnV IA Ems S ACE EA REA NK AOR, 对 
井 放 定 证 散 列 算 法 来 说 , EPR Fa = 0.5. BARRO BES Pa OR 
Uu nk 
5.4.1 线性 探测 法 

在 线性 探测 法 中 . 函数 上 是 i 的 线性 函数 , BI EEC) = i. 这 相当 于 逐个 探测 每 
个 单元 [必要 时 可 以 绕 辐 ) 风 查找 出 -个 空 单 元 . 图 5-11 显示 使 用 与 前 面相 同 的 夏 询 纯 数 将 
iB XHESISO, 18, 49, 58, 69: di A E- T LE rp e EO, E HERBA vp RE flt e 77 1L EE 
Fi) i 





图 511 每 次 插 人 后 使 用 线 此 探测 得 到 的 开放 定 址 散 列 表 


第 -个 证 罕 在 插入 关键 字 49 时 产生 ; ERRA F :个 空间 地址 ， 即 地 址 0 该 地 赴 是 二 
放 的 、 关键 字 SB 依次 和 IS, 89, 49 RAR, 试 选 二 次 之 后 才 找 到 - 个 空 单 元 。 对 的 的 冲 
灾 川 类 似 的 方法 处 理 。 只 归 表 足够 大 ， 总 能 够 找到 一 个 身 由 单元 , 但 是 如 此 化 费 的 时 间 是 相 
“ea. WAHE, ERRE, 这 样 占 据 的 单元 岂 会 开始 形成 一 些 区 块 ， 共 结果 称 为 
— E R primary clustering), Fue, SARK rat (p f 36 B CABG E UK ER oe HE 
mmh, ORIG dne es SU HEUS RD 

ORTEGA LR fox gu B HERE, 但 是 可 以 证 二, 使 Hy p rg i eg po 39] Pat ROT T iE 
入 和 不 成 功 的 查找 来 说 大 约 为 二 (1 + {41 - 4)), Mid FL RAEI RUMI 1 14 
qol QD. XS OA EE HERR - BREAST, aA BORO Ae RE RES 


_18 WV 


CRAY. EARED, AR BEER ELA RU EET ILE TR BEAD B) E81 [8] o 

如 果 聚 集 不 算是 问题 , 那么 对 应 的 公式 就 不 难得 到 . 我 们 假设 有 一 个 很 大 的 表 , 并 设 每 
次 探测 都 与 前 面 的 探测 无 关 。 对 于 随机 症 帘 解 洪 方法 而 言 , 这 些 假 设 是 成 立 的 , 并 且 当 不 
是 非常 接近 于 1 时 也 是 合理 的 。 首先 , 我 们 导出 在 一 次 不 成 功 咨 找 中 探测 的 期 望 次 数 ， 而 这 
正 是 直到 我 们 找到 一 个 空 单元 的 探测 的 期 望 次 数 。 由 于 空 单 元 所 占 的 份额 为 1 — A. 因此 我 
们 预计 要 探测 的 单元 数 是 1/0 一 A), 一 次 成 功 查 找 的 探测 次 数 等 于 该 特定 元 素 插入 时 所 需 
要 的 探测 次 数 。 当 一 个 元 素 被 播 人 时， 可 以 看 成 是 一 次 不 成 功 查 找 的 结果 - 因此 ,我们 可 以 
使 用 一 次 不 成 功 查 找 的 开销 来 计算 一 次 成 功 查找 的 平均 开销 。 

需要 指出 , 4 在 0 到 当前 值 之 间 变 化 ,因此 早期 的 揪 入 操作 开销 较 少 ,从 而 降低 平均 开 
销 。 例如 , 在 上 面 的 琢 中 , A = 0.5, 访问 18 的 开销 是 在 18 被 插 人 时 确定 的 , 此 时 4 = 0.2. 
由 于 tS 是 植 入 到 一 个 相对 空 的 表 中 ， 因 下 对 它 的 访问 应 该 比 新 近 插 入 的 元 素 ( 比 如 69) 的 访 
问 更 容易 , 我 们 可 以 通过 使 用 积分 计算 插入 时 间 平 均值 的 方法 来 估计 平均 值 ， 如 此 得 到 

1G)7 E]. Hori 

这 些 公式 显然 优 于 线性 探测 那些 相应 的 公式 。 聚 集 不 仅 是 理论 上 的 问题 ,而且 实际 上 也 发 生 
在 具体 的 实现 中 。 图 5-12 把 线性 探测 的 性 能 ( 虚 曲 线 ) 与 对 更 随机 冲 罕 解决 方法 中 期 望 的 性 
能 作 了 比较 。 成功 的 查找 用 S$ 标示 , 不 成 功 查 找 和 插入 分别 用 U 和 1 标记 。 


Ul 





15.0 
12.0 
9.0 
6.0 
30 ; 
A0 .18 .20 25 .30 35 .40 45 50 55.60 65 70 .75 .80 .85 .90 95 


Bl512 ”对 线性 探测 (虚线 ) 和 随机 方法 的 装填 因子 画 出 的 探测 次 数 
(S 为 成 功 查找 ; U 为 不 成 功 查找 ; M ENHA) 


如 果 A = 0.75, 那么 上 面 的 公式 指出 在 线性 探测 中 一 次 插入 预计 探测 8.5 次 。 如 果 A= 
0.9, 则 预计 探测 50 次 , 这 是 不 合理 的 。 假如 聚集 不 是 问题 , 那么 这 可 与 相应 装填 因子 的 4 次 
和 10 次 探测 相 纪 。 从 这 些 公 式 看 到 , 如 果 表 可 以 有 多 于 一 半 被 十 满 的 舌 ， 那么 线性 探测 就 个 
是 个 好 办 法 。 然 而 , 如 果 = 0.9, 那么 播 入 操作 平均 只 需要 探测 2.3 次 , 并 且 对 于 成 功 的 查 
找平 均 只 需要 探测 1.5 次 。 

5.4.2 平方 探测 法 

平方 探测 是 消除 线性 探测 中 一 次 素 集 问题 的 冲突 解决 方法 。 平方 探测 就 是 冲突 消 数 为 一 
VERBERE ER RU E. 流行 的 选择 是 上 (i) = 2, 图 5-13 显示 了 使 用 该 钟 突 函数 所 得 到 的 刁 前 
而 线性 探测 例子 相同 的 开放 定 址 散 列表 

«449 与 89 冲突 时 ,其 下 一 个 位 置 为 下 一 个 单元 , 该 单元 是 空 的 , 因此 49 就 被 放 在 屠 








HE. HG. 38 在 位 置 8 Abr Se, FUR ISR SIRI GR A: Top ag apse. 下 一 个 
Fs oc D ELS Oy 2^ — 4 web, 这 个 单元 是个 空 单 元 . 因此 , KEF 58 就 放 在 单元 2 
处 TAHT 69， 处 理 的 过 程 世 一 样 : 


[m + BEEN 
t (8 29 pe | ASO TASS ^ TA 69 il 
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图 5.13. 在 每 次 插入 后 , HAEA ERA JT RC E EL ze 


对 十 线性 探测 ,让 元 标 几 乎 填 满 散 列 表 并 不 是 个 好 主意 ,内 为 此 时 表 的 性 能 会 降低 。 对 
于 平方 探 浏 情况 甚至 更 精 : 一 号 表 被 填 满 起 过 -- 半 ， 当 表 的 大 小 不 是 素数 时 其 至 在 表 被 填 渍 
-opzi 就 不 能 保 让 一 次 和 到 一 个 空 单元 了 。 这 是 因为 最 和 多 有 表 的 一 六 可 以 用 作 解 决 冲 突 
iE Sata 

我 们 现在 就 来 证 明 ， WERA- AESA, HLTA ERM, 那么 我 们 保证 总 能 够 
插入 -个 新 的 元 素 


定理 5.1 

如 果 使 用 平方 探测 ， 且 表 的 大 小 是 素数 , 孝 么 当 表 至 少 有 一 半 是 空 的 时 外 ,总 能 够 十 入 
xu ps. 

证 明 : 


分 表 的 大 小 TableSize 是 一 个 大 丁 3 i 4) RR. RINEN, 前 L TableSizeA2J 个 备 选 位 
RARI AIX) + Ümod TableSize )JFüACX) + j (mod TubleSize Mut a PAY 
个 . 其 由 0 < i, je TableSise/ 21. NIE TI. 假 没 这 项 个 位 置 相同 , (iy, P 

ACM) = f= AX) + y) (mod TableSize ) 


i= gt (mod TableSize ) 
i-g-10 (mod TableSize ) 
(2 — gp) fi ty) 70 (mod TableSize ) 


由 于 TableSize Méx, 因此 , BAG - 门 等 于 0(mod TableSize), BAU + J) T N mod 
TableSize ). BEER i HI) RH SEI, 那么 第 一 个 选择 是 不 可 能 的 BO < i. g TableSize? 
2'. 因此 第 二 个 选择 也 是 不 可 能 的 。 从 和 而, B TableSize/ 2 PAARE LR. m 
情人 的 元 灶 { 若 无 任何 冲突 发 牛 ) 也 可 以 放 公 经 散 列 得 到 的 单 志 ,因此 任何 元 素 部 有 
Tapfesize /21 个 可 能 被 放 到 的 位 置 .如 果 最 多 有 :TabieSize /24 个 位 时 可 以 使 用 , BEA EE 
元 总 能 够 找到 。 
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| Ko* 
哪 伯 表 有 比 一 半 多 一 个 的 位 置 被 填 满 ,那么 插入 都 有 可 能 失败 (虽然 这 是 非常 难以 见 到 


的 )。 把 它 记 住 很 重要 。 另 外 , RAD ARR AER RE. 如果 表 的 大 小 不 是 素数 ,， 则 备 
选单 元 的 个 数 可 能 会 锐 减 。 例 如 , 奋 表 的 大 小 是 16, RABBIT RAE RIE 1, 4 或 9 


距离 处 。 


在 开放 定 址 散 列 表 中 , 标准 的 删除 操作 不 能 施行 ,因为 相应 的 单元 可 能 已 经 引起 过 冲 
A, 元 素 绕 过 它 存在 了 别处 . 例如 ， 如 果 我 们 删除 S9, 那么 实际 上 所 有 其 他 的 Find 例 程 都 将 
不 能 正确 运行 。 因 此 , 开放 定 址 散 列 表 需 要 懒惰 删除 , 虽然 在 这 种 情况 下 并 不 存在 天 还 意义 


Ea RAR 


实现 开放 定 址 散 列 方法 所 需要 的 类 型 声明 在 图 5-14 中 表示 。 这 里 , 我 们 不 用 链 肯 数组 ， 
而 是 使 用 获 列 表 项 单元 的 数组 ,与 在 分 离 链 接 散 列 中 一 样 , 这 些 单元 也 是 动态 分 配 地 址 的 : 
该 表 的 初始 化 (图 5-15) 由 分 配 空间 (第 1 行 到 第 10 行 ) 及 其 后 的 将 每 个 单元 的 Info 域 设置 为 


Empty 组 成 。 


Q RURSUM 48+ 3 的 素数 ， 且 使 用 的 平方 冲突 解决 方法 为 POS ti, 那么 整个 表 均 避 被 探测 到 . 












xifndef _HashQuad_H 





typedef unsigned int Index; 
typedef Index Position; 


























struct Hashib!, 
typedef struct HashTb] *HashTable; 


HashTable InitializeTable( int TableSize ); 

void DestroyTable( HashTahle H ); 

Position Find( ElementType Key, HashTabla H J; 

void Insert ElementType Key, HashTable H J; 
ElementType Retrieve( Position P, HashTable H 3; 
HashTable Rehash( HashTable H 2; 

/* Routines such as Delete and MakeEmpty are omitted */ 


#andif  /* .HashQuad H */ 


/* Place in the implementation file */ 
enum KindOfEntry { Legitimate, Empty, Deleted }; 


struct HashEntry 

{ 
ElementType Element; 
enum KindOfEntry Info; 

h 


typedef struct HashEntry Celi; 


/* Cell *TheCells will be an array of */ 
/* HashEntry celts, allocated later * 
struct HashTb] 
{ 

int Tablesize; 

Cell *TheCet is; 
E 


图 5.14 ”开放 定 址 散 列 表 的 类 型 声明 


(Or ON ie Iii lo EE 


其 代 


Hashtable 
Initial'izeTable( int TableSize ) 
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Hash'ab!e H; 


| 
| int 3: 
| A [tee ifi TableSize < MinTableSize } 
{ 
/* 2 / Error "Table size too small" 3; | 
/* 3y return NULL; 
| i 
/* Allocate table */ 
| fm gry H = malloc’ sizeof struct HashTbi 7 3; 
/* 5*/ ifi H == NULL b 
/* Ber Fatal£rrar( "Out of space!!!" 3; 
A Phy H-»TabieSize = NextPrime( TableSiza ); | 
/* Altocate array uf Cells */ 
J= Bry H-»TheCells = malloc( sizeof( Call ) * H-»TahleSize 3; 
fe ge iff H-»TheCells == NULL ) 
/*l0*y/ FatalError( "Out of space!!!" j; d 
A forf 3 = 0; i « H-»TableSize; i++ 3 | 
J*i2*/ H-»TheCellsE i ].l1nfo = Empty; | 
| Fl return H; 
| 


图 5-15 初始 化 开放 定 址 获 列 表 的 例 黎 


如 同 分 离 链 接 散 列 法 - - 样 ， Find( Key, 万 ) 将 返回 Key 在 散 列表 中 的 位 置 。 如 果 Key 不 
HW 那么 Find 将 返回 最 后 的 单元 。 该 单元 就 是 当 需 要 时 ，Key 将 被 插入 的 地 方 。 此 外 , E 
为 被 标记 了 Empty, 所 以 表达 Find 失败 很 容易 ; 为 了 方便 起 见 , 我 们 假设 散 列 表 的 大 小 至 少 
为 发 中 雹 素 个 数 的 二 倍 ,， 因 此 平方 探测 方法 总 能 够 实现 。 否 则 , 我 们 就 要 在 第 4 行 前 测试 ; 





ye ity 
fe 2j 
/* 34/ 


f» aey 
f^ Se 
/* 6 


fe aes 


Position 
Find( ElementType Key, HashTable H 3 
1 


Position CurrentPos; 
int CollisianNum; 


CollisionNum = 0; 
CurrentPos = Hash( Key, H-»TableSize 3; 
while€ H-»TheCells[ CurrentPos ].Info !- Empty && 
H-»TheCelis— CurrentPos J.Element != Key 2 
;* Probably need strcamp!! */ 
| 
CurraentPos + 2 * «CollisionNum - 1; 
ifC CurrentPos >= H->TableSize ) 
CurrentPos -= H-»TableSize; 
} 


return CurrentPos; 





图 5-46 ”使 用 平 太 探测 散 列 法 的 Find GEE 


第 4 行 到 第 6 行为 进行 平方 探测 的 快速 方法 。 由 平方 解决 函数 的 定义 可 若 , FO) = 
FG - 1) + 2i - 1, 因此 ,下 一 个 要 探测 的 单 苑 可 以 用 素 以 2{ 实 际 上 就 是 进行 一 位 二 进 
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制 移 位 } 并 减 1 来 确定 。 如 果 新 的 定位 越过 数组 , 那么 可 以 通过 减 去 TableSize 把 它 拉 回 到 数 
组 范围 内 。 这 上 比 通常 的 方法 要 快 , 因为 它 避 免 了 看 似 需 要 的 乘法 和 除法 。 注意 一 条 重要 的 警 
告 ; 第 三 行 的 测试 顺序 很 重要 ， 切 细 改 变 它 ! 

最 后 的 和 例 程 是 插 人 。 正如 分 离 链 接 散 列 方法 那样 , 阁 Key 已 经 存在 ， 则 我 们 就 什么 也 不 
RW. 其 他 工作 只 是 简单 的 修改 。 耕 则 , 我 们 就 把 要 插入 的 元 素 放 在 Find 例 得 指出 的 地 方 。 程 
序 在 图 5-17 中 显示 。 


void 
Inserti Elementlype Key, HashTable H 3 
{ 


Position Pos; 


Pos = Find( Key, H ); 
ifC H->TheCells[ Pos ].Info != Legitimate ) 


{ 

/* OK to insert here */ 
H->TheCellsf Pos ].Info = Legitimate; 
H->TheCells[ Pos ].ETement = Key; 

/* Probably need strcpy! */ 





图 5-17 AY RRR RANE 


虽然 平方 探测 排除 了 一 次 聚集 , 但 是 散 列 到 同一 位 置 上 的 那些 元 素 将 探测 相同 的 备 选 单 
Fe, IX MUA E A (secondary clustering)。 二 次 聚集 是 理论 上 的 一 个 小 缺憾 。 模拟 结果 指出 ， 
对 每 次 查找 , 它 一 般 要 引起 另外 的 少 于 一 半 的 探测 ,下面 的 技术 将 会 排除 这 个 缺憾 , 不 过 这 
雪花 费 另 外 的 一 些 乘 法 和 除法 。 
5.4.3 WHF 

我 们 将 和 本 考察 的 最 后 一 个 冲 讼 解决 方法 是 双 散 列 (double hashing)。 对 于 双 散 列 , — fbit 
行 的 选择 是 F(i) = ie pewmha(X)。 这 个 公式 是 说 , 我 们 将 第 二 个 散 列 函 数 应 用 到 X 并 在 距 
Bj hasha (X, 2hah2( 关 ) 等 处 探测 。hash( 关 ) 选 择 得 不 好 将 会 是 灾难 性 的 。 BIR, SHE 99 fü 


入 到 前 面 例 子 中 的 输入 中 去 , 则 通常 的 选择 hash; (X) = X mod 9 将 不 起 作用 。 因 此, 0833 
一 定 不 要 算得 0 (A. 另外 , 保证 所 有 的 单元 都 能 被 探测 到 (在 下 面 的 例子 中 这 是 不 可 能 的 因 


为 表 的 大 小 不 是 素数 ) 也 是 很 重要 的 。 诸如 Aasha X) = R ~ CX mod R) 这 样 的 函数 将 起 到 
良好 的 作用 ,其 中 R 为 小 于 “abteSize 的 素数 。 如 果 我 们 选择 尺 = 7, 图 5-18 加 显示 插入 与 


前 面相 同 的 关键 字 的 结果 。 


第 一 个 冲突 发 生 在 49 被 插 人 的 时 蛋 。hash2(49) = 7 — 0 = 7, 8X 49 被 插入 到 位 置 6。 
hash4(58) = 7 - 2 = 5, 于 是 58 被 插入 到 位 置 3。 最 后 ,69 FER, 从 而 被 插入 到 距离 


为 hash2(69) = 7 - 6 = 1 的 地 方 。 如 果 我 们 试图 将 60 插入 到 位 置 0 处 ， 那么 就 会 产生 一 个 


冲突 。 由 于 hash(60) = 7 — 4 = 3, 因 此 我 们 尝试 位 置 3, 6, 9, 然后 是 2， 直到 找 出 一 个 室 
的 单元 。 一般 是 有 可 能 发 现 某 个 坏 情 形 的 ， 不 过 这 里 没有 太 狗 这样 的 情形 。 
前 面 已 经 提 到 ,上面 的 散 列 表 实 例 的 大 小 不 是 素数 。 我 们 这 么 伍 是 为 了 计算 散 列 函数 时 


方便 , 但 是 ， 有 必要 了 解 在 使 用 双 散 列 时 为 什么 保证 表 的 大 小 为 素数 是 重要 的 。 如 果 想 要 把 
23 插 人 到 表 中 , 那么 它 就 会 与 58 发 生 冲 突 。 由 于 hash2a(23) = 7 一 2=5， 下 该 表 大 小 是 


10, 因此 我 们 只 有 一 个 备 选 位 置 , 而 这 个 位 置 已 经 使 用 了 。 因 此 ， 如 果 表 的 大 小 不 是 素数 , A 
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么 备 选单 元 就 有 可 能 提前 用 完 。 然 而, 如 及 双 散 列 正确 实现 , MEUR. WOU OM 
儿科 和 随机 冲突 解决 方法 的 情形 相同 。 这 使 得 权 散 列 理论 上 很 有 哎 引 力 . 不 过 , 平方 探测 不 
需要 使 用 第 一 个 散 列 丽 数 ， 从 而 在 实践 中 叮 能 不 简单 并 且 更 快 ， 


一 一 一 -， == 


EAG | 


| s | 








5.5 BEES 


wT RSE yA PE IE, RATS A, AB BAF BUE frIb In] HF 
开始 消耗 过 长 , H Insee 操作 可 能 失败 这 可 能 发 生 在 有 太 多 的 移动 和 插 人 混合 的 场合 . 此 
(b. —Rbdg ie Bib mM TA Kg CT PSY ARCU eR, HR 
SARE, HABEN CS ER S) C SIEG CH (ELO TRE HC ACE nn 

例如 , 设 将 元 素 13. 15, 24 和 6 搬 人 到 大 小 为 了 的 开放 定 十 艇 列表 中 : APRA CX) 
= X mod 7. 设 使 用 线性 探测 方法 解决 冲突 问题 . 插入 结果 得 到 的 散 列 表 肯 示 在 图 5-19 
中 

旭 果 将 23 fi A d rh, 那么 图 5-20 中 插入 后 的 表 将 有 超过 70% 的 单元 是 满 的 。 SL GR 
得 过 满 , 所 以 我 们 建立 一 个 新 的 表 : 该 表 大 小 之 所 以 为 17, 是 因为 17 EER RAAF I hS 
PES. READE BON AX) = X mod 17。 扫描 原 米 的 表 , HÉJA 6, 15, 23, 2414 
及 13 揪 人 到 新 表 中 。 最 后 得 审 的 表 见 网 5-21, 











of 6 oi 6 | 
| n p _ 
1 15 ' 15 
2 | NN 23 
3 4 TN 4 
mttu 一 ”一 一 一 
4 | LÀ 4 一 EE | | 
5 g | 5 = 
6! 13 E eoo E i 
fo os ooo 
图 519 使 用 线性 探测 揪 人 13. 15, 图 s-20 和 使 用 线性 探测 插入 
6, 24 Waal RECHT e 23 MAA CREE REOR 


124 BSF 


S SPE PERE ER (rehashing), 显然 这 是 一 种 非常 昂贵 
BERE. 其 运行 时 间 为 O(N), 因为 有 N 个 元 素 要 再 散 列 而 表 的 
大 小 约 为 2N, 不 过 , 由 于 不 是 经 第 发 生 , 因此 实际 效果 根本 没有 
这 么 差 。 特 别 是 ,在 最 后 的 再 散 列 之 前 必然 已 经 存在 NA2 次 
Insert， 当 然 添加 到 每 个 插入 上 的 花费 基本 上 是 一 个 常数 开销 。 ~ 
如 果 这 种 数据 结构 是 程序 的 一 部 分 , 那么 其 效果 是 不 显著 的 ; 田 
一 方面 ， 如 果 再 散 列 作为 交互 系统 的 一 部 分 运行 , 那么 其 搬入 引 
起 再 散 列 的 不 幸 的 用 户 将 会 感到 速度 减 慢 。 

再 散 列 可 以 用 平方 探测 以 多 种 方法 实现 。 一 种 做 法 是 只 要 表 满 
到 一 半 就 再 散 列 。 另 一 种 极端 的 方法 是 只 有 当 揪 人 失败 时 才 再 散 OT! 
5$). 第 二 种 方法 即 途中 (middleof the road) RM: 当 表 到 达 某 一 个 装 
填 因 子 时 进行 再 散 列 。 由 于 随 着 装填 因子 的 增加 表 的 性 能 的 确 有 下 
UE, 因此 , 以 好 的 截止 手段 实现 的 第 三 种 策略 , 可 能 是 最 好 的 策略 。 |， 

再 散 列 把 程序 员 从 表 太 小 的 担心 中 解放 出 来 , 这 一 点 很 重 15 
E 因为 在 复杂 的 程序 中 散 列 表 不 能 够 做 得 任意 她 大。 后 面 的 练 1 
习 让 你 考查 再 散 列 与 懒惰 删除 联合 使 用 的 情况 。 再 散 列 还 可 以 用 
在 其 他 的 数据 结构 中 。 例如 ,如果 第 3 章 队 列 数据 结构 变 满 时 ， — coi 在 再 散 列 之 后 
孝 么 我 们 可 以 声明 一 个 双 倍 大 小 的 数组 ,并 将 每 一 个 成 员 找 贝 过 的 开放 定 址 散 列 表 
来 , 同时 释放 原来 的 队列 。 

图 5-22 FEAR, FRAT AY SE BR fal R. 
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HashTable 
Rehash( HashTable H 3 
i 

int i, OldSize; 
fell] *Oldcelis: 


f* l*/ OldCells = H-»TheCells; 
f* 2*6 OldSize = H-»TableSize; 


/* Get a new, empty table */ 
f* a*/ H = InitializeTable( 2 * OldSize J); 


/* Scan through old table, reinserting into new */ 


fr 4"j for( i = 0; i < OldSize; i++ ) 
f* 5*7 iff OldCells[ i J.Info == Legitimate } 
f/* G Insert( OldCeils[ i l.Element, H 3}; 


i Fes freet OldCelts }; 
A #/ return H; 
} 


5-22 ”对 开放 定 址 散 列 表 的 再 散 列 


5.6 可 扩散 列 
本 音 最 后 的 论题 处 理 数据 量 太 大 以 至 于 装 不 进 主 存 的 情况 。 正 如 我 们 在 第 4 章 看 到 的 ， 


Oo 这 就 是 为 什么 新 表 要 做 成 老 才 岗 倍 大 的 原 关 。 


R $i | 24 


HEITER EEE EN R SR UII Sa CC - 
与 前 面 : E, 我们 假设 在 任 一 时 肇 都 有 N TG (AA N BUTE Gr EIC IT. 
最 多 可 把 M 个 记录 放 入 - MEEKER ATE M = 4. 
QTR AW RAE IEA UIA oR ot EE UTA, 邢 么 主要 的 问题 芷 于 、 在 一 次 Find HEE 
i]. akp EE KERA, OPA TAE o> AP od a eR Se. DLE. CH 
ACD TRL RAST, TTR BAX —3b, EE OCNOUIX E SAT. 
-AHER E) e FE OY ie AP aK, extendible hashing). E feiTH)I IK EEA ALIA T R 
Find, Ja ABE fE tm BRE 9 ERREUR HI. 
回忆 第 4 3€, B- 树 具有 深度 O(logua NO. BMA M E, B-REIBIZRIE DER Hie ES 
们 可 以 选择 M 如 此 的 大 , BERE BARREA 1. 此 时 , 在 第 一 次 以 后 的 任何 Find 部 将 花费 一 [167 
gk BEDS], 因为 据 推 测 根 节点 可 能 存在 主 存 中 . 这 种 方法 的 问题 在 于 分 文系 数 (branching os! 
factor) kA, META TENOREA RI EEIT REPARE TTE. Sa fri — Lier) | 
时 间 可 以 减 缩 , 那么 我 们 就 将 有 - :个 实际 的 方案 : 这 正 基 可 扩散 列 司 用 的 要略 . 
现在 让 我 们 假设 , 我 们 的 数据 由 儿 个 5b 比特 整数 引 成 ， 图 5-23 显 术 这 些 数据 的 可 扩散 列 
iat. 树 ” 的 根 含有 4 个 指针 ,它们 由 这 些 数据 的 前 两 个 比特 确定 每 片 树 时 有 百 到 AT = 
ATH 碰巧 这 里 每 片 树叶 中 数据 的 前 两 个 比特 都 是 相同 的 ; 这 由 图 括号 内 的 数 指 出 :为 
fs. 用 D 代表 根 所 使 用 的 比特 数 , 有 时 称 其 为 目录 (direetery)- 于 是 ,目录 中 的 项 北 
3; 22. q, 为 树叶 工 所 有 元 素 共 有 的 最 高 位 的 倍数。d FRE FERAN, BE dim D. 
ares ASE 100100. tc UE AGB E aT, 但 是 第 一片 树叶 已经 满 了 ， IE as [RETE 
fice, RERE gm AERUE E HUE, ET RS a eG BOREAS 


增加 到 3 ”这些 变化 通过 图 5-24 反映 出 来 。 
[pw Ta 
\ Z 
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111000 


inl 





& 523 可 扩散 并 : 原始 数据 E 524 al pees, fr 00100 dA RA RA AN 


注意 , HD AES LTE TE p PL RARE xim. FA. BOR PORES. 
43 E Ho ftp up Be A m TAH. 

AD BE ERE ACHE F 000000. 362,28 - HE REDESUE BUT RE. 生成 4, = 3 RORIUTRITE 由 
PD = 3. 故 在 目录 中 所 做 的 性 一 变化 是 000 和 001 指针 的 更 新 - 外 图 5-25, 

这 个 目 常 简单 的 方法 提供 了 对 大 型 数据 库 Insert 操作 和 Bind 操作 的 快速 在 到 时 间 , 这 
H, GRIT HT TF ARIE 

首先 , AMS HB MCR TD + ^- Bj 5j c FH d HES ELE ARS T 
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ii, SER rae, D = 2, WRA 111010, 111011, 并 在 最 后 搬入 111100, 那么 月 录 
大 小 必须 增加 到 4 以 区 分 五 个 关键 字 ,。 这 是 一 个 容易 考虑 到 的 细节 , 但 是 千 万 不 要 忘记 它 。 
其 次 , 存在 重复 关键 字 (duplicare key MOREE AES FE M 个 重复 关键 字 , 则 该 算法 根本 
无 歼 。 此 时 ,需要 做 出 某 些 其 他 的 安排 。 


pa Pe [oe [on Tu Te Poe Tony 
(2) 
111000 


(3 






(3) } C2} (3) 
(00000 | 001000 | [010100 | | 100000 [ [101000 
OOOO) iG01010 | 4011006 1 | TOO TOO | 1 1OT EGO | [111001 


001011 


图 5-25 可 扩散 列 : 在 000000 插 人 及 树叶 分 裂 后 


这 些 可 能 性 指出 ， 这些 比特 完全 随机 是 相当 重要 的 , 这 可 以 通过 把 这 些 关键 字 散 列 到 合 
理 长 的 整数 (因而 是 名字) 来 完成 。 

BIS, 我 们 介绍 可 扩散 列 的 某 些 性 能 , 这 些 性 能 是 经 过 非常 困难 的 分 析 后 得 到 的 。 这 些 
结果 基于 合理 的 假设 : EX bir pattern Z&15 5] 2r TE B] 

树叶 的 期 望 个 数 为 (N/M)logze。 因 此, 平均 树叶 满 的 程度 为 2 = 0.69, 这 和 BA TE: 
RE. 其 实 这 完全 不 奇怪 ,因为 对 十 两 种 数据 结构 , 当 第 (AM + 1) 项 被 添加 时 , 一些 新 的 
节点 就 建立 起 来 。 

更 惊 瑚 的 结果 是 ,日 录 的 期 望 大 小 ( 换 句 话说 即 272g OXON! MM). 如 果 M 很 小 ， 
那么 月 录 可 能 过 和 分 地 大。 在 这 种 情况 下 , 我 们 可 以 让 树叶 包含 指向 记录 的 指针 而 不 是 实际 的 
记录 , 这样 可 以 增加 M 的 值 。 为 了 维持 更 小 的 日 录 , 可 以 把 第 二 个 磁盘 访问 座 加 到 每 个 Find 
操作 中 去 。 如 果 目 录 太 大 装 不 进 主 存 , 那么 第 二 个 磁盘 访问 怎么 说 也 还 是 需要 的 。 


Bs ot 


ID ZE 


sci ei] BL FASE DL ROR DS EE] SIC. Insert 和 Find 操作 。 当 使 用 散 列 表 时 , 注意 诸如 装 
HATRA TERHES, 否则 时 间 界 将 不 再 有 兹 。 当 关 键 字 不 是 短 串 或 整数 时 , F 
组 选择 散 列 函数 也 是 很 重要 的 。 

对 于 分 离 连接 散 列 法 ,虽然 装填 因子 不 很 大 时 性 能 并 不 明显 降低 ， 但 装填 因子 还 是 应 该 
接近 于 1。 对 于 开放 定 此 散 列 算法 , 除非 完全 不 可 避 仇 ， 否则 装填 因子 木 应 该 超过 0.5。 如 玉 
使用 线性 探测 ,那么 性 能 随 着 装填 因子 接近 于 1 将 急速 下 降 。 再 散 列 运算 可 以 通过 使 表 增 长 
(或 收缩 ) 来 实现 ,这样 将 会 保持 合理 的 装填 内 子 . 对 王 空间 紧缺 并 ELA T RETE RE AC BOAT e 
的 情况 ,这 是 很 重要 的 。 

一 叉 查 找 树 也 可 以 用 来 实现 Insert 和 Find i 虽然 平均 时 间 界 泥 O(log ND. 但 是 二 
及 查找 树 也 支持 那些 需要 序 的 例 程 从 而 时 强大 。 使 用 散 列表 不 可 能 找 出 最 小 元 束 。 除非 准确 
AE me. BRB AEA A) EA HERE — RARE IE Ee 


UR Bl ii SL o fi Hine JE SG E DERI E : 

男 一 方面 . goce OS ROK A PSU aS. m4 IP BUR LA ED RETE SUME ty 
MBA. Fy ATR RSE EE IE. TRUE. |RSS SEA E A L RTEA iE EHE 
有 怀疑 , 那么 就 应 该 选择 散记 这 种 数据 绪 构 ， 

BUT EAE ELE Ru 编 详 器 使 用 散 列 去 跟 蜂 源 代 码 中 态 明 的 变 明 PR PAO fe 
TE3 (symbol tabie]， 散 列表 是 这 种 问题 的 理想 应 用 , 因为 只 有 Insert 和 Find Wair. PRIH 
ff - 般 都 不 长 , BEHE RR EE a HI. 

Hos PIECE A Bg. (EFIE. Td 83 bs Hm n xt 
"Fo XB, 当 输 入 被 读 进 的 时 候 , 顶点 则 按照 它们 出 现 的 顺 抒 从 eee A EE. BR 
AL, 输入 很 可 能 有 一 组 -一 组 依 字 母 央 闻 排 麟 的 项 . 例 好 , 顶 避 可 以 是 计算 机 - 此 时 ， 如 来 “个 
特定 的 计算 中 心 措 它 的 计算 机 列表 成 为 bml. ibm2. ibm3. 等 等 , OBA, Erf Ré dE IE TE 
Af 25 Jy itp uT BE RE XE DICH 

Bos) eG SS = he X TIER eT Ay A ag ERIT PER PRE [RE EET. 
TEBE tt BE Bene ij m. UR RA SE, RU EDS 
通过 简单 移动 变换 来 避免 郧 贵 的 重复 计算 游戏 程序 的 这 种 JA E nu fr HE d E (rraneposi 
tion table). 

敬 列 的 另 . -个 用 途 是 在 线 拼写 检验 程序 如果 错 拼 检测 ( 与 正确 性 相 比 ) 更 市 要 ， 部 么 党 
个 时 妥 可 以 被 再 散 列 , 单词 则 可 以 在 常数 时 问 内 被 检测 CPU etae Aik DE, PL 
母 顺序 排列 单词 并 不 重 上 要 ; TET TE SAE HCBU ons CRB ER PEAT 

我 们 通过 返回 到 第 LESE BK aE SER x-- du. Bn aifh HS 1 Ps T 
法 ,并 日 假 设 最 大 单词 的 太 小 是 菜 个 小 常数 ,那么 读 入 包含 W TR BIO E A EER AH 
wile ait fap OCW). XP LAB AT BE RA O RH RR ie ACE. HS 
(HAR HE - puso, FU, 方向 , 字符 数 ) 测 试 - PR, 由 十 每 次 有 
海 时 间 为 OC, 而 只 存在 常数 个 方向 (8) 和 每 个 单词 的 学 符 . 内 此 这 一 阶段 的 运行 时 间 为 
ORC). 总 的 运行 时 间 是 ORC + WO. 它 是 对 原始 OCR CW ETAT He A BE 我 们 
还 可 以 做 进一步 的 优化 , 它 能 够 降低 实际 的 运行 时 间 。 这 些 将 在 练习 中 挡 述 : 


练习 
5.1 给 定 和 输入 ,4371. 1323, 6173, 4199, 4344, 9679. 1089) ALAC vA ACN = 
X (mod 10), 指出 结 琳 ; 
a. 分 离 链 接 艇 列表 。 
b. 使 用 线性 探测 的 开放 定 持 散 列 表 . 
c, 使 用 平方 探测 的 开放 定 进 破 列表 
d. 第 二 前列 隐 数 为 hy 入 ) = 7 (Xmod DÉIF GE HEAL PY - 
5.2 指出 将 练习 5.1 PATRAS LRU mE 
5.3 编写 一 个 程序 , HEBCRE FA PEREQN  GEIPRU D Be ABO HAW BR PLE UBI 32 
的 冲突 次 数 。 | | 
5.4 (A BS REAR TUBS GEE ACER BER TEERAA IR TH) 在 这 种 情况 
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下 , 我 们 可 以 再 散 列 一 个 表 , 大 小 为 原 表 的 一 半 , 设 当 存在 相当 于 表 的 天 小 的 二 倍 
BASH AHR. 我 们 再 散 列 到 一 个 更 大 的 表 。 企 再 散 州 到 一 个 更 小 的 表 之 
Hl, BRIM KA AR? 
另 一 种 冲突 解决 策略 是 定义 AEI] F(2) = n. HP ros OA ri ra, eee FN 
是 前 N d EXER BERL HEH AEI Bi 2K), 
, 证 明 , 在 这 种 策略 下 ,如果 表 不 满 , 那么 冲突 总 能 够 被 解决 ， 
,能够 期 望 这 种 策略 会 消除 聚集 码 ? 
， 如 果 表 的 装填 内 子 是 A. 执行 一 次 插入 的 期 望 时 间 是 凶 少 ? 
.如 果 表 的 装填 因子 是 4, 执行 一 次 成 功 查 找 的 期 望 时 间 是 多 少 ? 
一 个 有 效 算法 {理论 上 以 及 实际 上 ) 生 成 随机 序列 。 SERES fI ASTE PP 的 那 
些 法 则 是 重要 的 ? 
各 种 冲 罕 解决 方法 的 优点 和 缺点 是 什么 ? 
编写 一 个 程序 , 实现 下 面 的 方案 , 将 大 小 分 别 为 M 和 和 NN WAA E T sparse 
polynomial) P, 和 P; HR. 每 个 多 项 式 代 表 一 个 链表 , BHM SM HARM. HU 
及 Next 指针 组 成 (练习 3.7)。 FIA P; 的 项 乘 以 P, 的 每 一 项 ， 总 的 运算 次数 为 
MN. 一 种 方法 是 将 这 些 项 排序 并 合并 同类 项 , 但 是 . 这 需要 排序 MN 个 记录 , 代 
(aT REAR ES. 特别 是 在 小 内 存 环境 下 , 另 -- 种 方案 , 我 们 可 在 多 项 式 的 项 进行 计算 
时 将 它们 合并 ,然后 将 结 采 排序 。 
a. 编写 一 个 程序 实现 第 二 种 方案 。 
b， 如 果 输 出 多 项 式 大 约 有 OCM + NPR, BERI SR TI BL Bb? 
-个 拼写 检查 程序 读 进 一 个 输入 文件 并 显示 出 所 有 在 某 个 在 线 词 典 土 坦 不 出 的 单 
词 . 设 该 词典 含有 30000 单词 ,而 文件 很 大， 以 至 于 算法 只 能 对 该 输 和 人 文件 进行 一 
未 检查 。 一 种 简单 的 方案 是 将 该 词典 读 入 一 个 散 列表 , 随 着 单词 的 被 读 进 而 查找 每 
一 个 单词 设 一 个 平均 单词 有 -七 个 字符 并 且 能 够 将 长 度 为 上 的 单词 大 入 L + 1 个 
字 节 中 (因此 空间 的 浪费 不 像 考 虑 的 那么 多 ), 假设 有 一 个 开放 定 址 表 , XE IP 
空间 ? 
如 果 内 丰 有 限 并 且 整 个 目录 不 能 装 进 一 个 散 列 表 中 , 那么 我 们 仍然 能 够 得 到 一 个 有 
效 的 算法 , 该 算法 几乎 总 能 正常 工作 ， 我 们 声明 一 个 位 Lbit) 数 组 Tabie (CR 
化 均 为 0) ,数组 大 小 从 (和 到 TubleSize - 1。 当 读 进 一 个 单词 时 , RIE Table 
[ Hash( Word) j= 1。 下 列 鱼 论 哪 个 止 确 ? 
4. 如 果 一 个 单词 散 列 到 -个 其 值 为 0 的 位 置 , 那么 该 单词 不 在 词典 中 ， 
b， 如 果 - 一 个 单词 淫 列 到 一 个 其 值 为 1 的 位 置 , 那么 该 单词 在 词典 由。 
假设 我 们 选择 TableSize = 300 007. 
c. Ein BETTE? 
d. TEC E PH BE Tr RERO EE EP 
e. HSC MT 500 个 单词 , 可 能 每 页 有 3 个 实际 拼写 错误 ; 该 算法 是 宕 可 有 岂 ? 


o no cm 


» 5.10 Hob SRS TRE EC Rt O TARAR). 


5.11 


设 欲 找 出 在 长 输入 串 ALAS Ax PR P P Pi 的 第 一 次 出 现 。 fij AY EU GERE 


PEE HB (pattern. string) 得 到 一 个 散 列 值 日 ， 并 通过 将 该 值 与 从 ALAz... Ag 





AAA AsAg.. Agia, SAR AY. pe Ay poo. AV ERRENA 
Hog AGAR. RRR TTS PB. SAR DEM 一 个 字符 
He Op HE Ay CR Re PPL A BOR RSC BS SOCAL. AS ZR CE A 中 的) 
(UBL, TEPC CA Xk BH AS ACU] RET EUG PARE ETT 

sa. 证 明细 此 AA. )...4,., {AOE LA, ABA A, A, 2... ALL RR a A 

M 常数 时 间 算 出 

b. 证 明和 运行 时 间 为 Ofek + NO) LEES ROL ACA BE ERST Fa] 

«c. UEPB RVE REUS B3 ERE RU ERE 

d. fah- -个 程序 实现 该 算法 。 

eec 描述 一 个 算法 . 其 总 坏 情形 的 运行 时 间 为 Ok + N) 

~ +f. 描述 -个 算法 ,其 平均 运行 时 间 为 OCN) 

5.12 个 BASIC 程序 由 一 系列 按 递 增 蛋 序 编 号 的 语句 组 成 PS ABE EEA goto 或 
gosub 后 如 - :个 语句 序号 实现 的 - 编 寺 一 个 程序 让 进 合 法 的 BASIC Pep TSR ali JE 
新 编 贞 ,使得 第 -名 在 序号 下 外 开始， AEE- -个 语句 的 序号 比 前 ERE D- IR 
可 以 假设 N 条 语句 的 一 个 上 限 , 但 是 在 输入 中 ,语句 序号 可 以 大 到 32 ERR 
Xx. 你 的 程 译 必须 以 线性 时 间 运 行 : 

5.13 a. 利用 本 章 示 尾 描述 的 算法 实现 字谜 程序 、 

b. 通过 存储 每 一 个 单词 W 以 及 w 的 所 有 前 绷 , 我 们 可 以 大 大 加 快运 行 速 度 .如 
ow 的 :个 前 级 刚好 是 词典 中 的 - :个 单 闻 , RARE PE Sd OK A 
(i, ) BSR BOR BIR AHS IT RON RRA, 但 实际 上 并 不 是 ,因为 许多 单 
词 有 相间 的 前 绕 、 当 以 某 个 特定 的 方向 执行 -次 扫描 的 上 时候 ,如果 被 查找 的 早 词 
作为 前 织 不 在 散 列表 中 , MAEA AALA AA RE. ATR 
diy C rp BUY ORE EC Y REDRO | 2R 

c. 如 果 我 们 愿意 御 牧 散 列 表 ADT 的 严肃 性 . MARITE) BB RE PR E - 
例如 ， 如 果 我 们 刚刚 计算 出 ”excel” 的 散 到 函数 , 那么 我 们 就 不 必 青 从 头 开始 计 
fk" excel” SER PI PS ET. y s gcn vs v SERE ALT SP 

d. 看 第 2 eet (CE DURS Rb p fede. 把 使 用 前 组 的 想法 结合 到 你 的 对 分 查找 和 工法 
牛 。 修 改 工 作 应 该 很 简单 .哪个 算法 更 快 ” 

s 14 指出 将 关键 字 10111101, 00000010. 10011041, 10111110, OI TITI2I, 01010001 , 
10010110. 00001011, 11001111. 10011110, 11011011, 00101011. 01100001, 
11110000. 01101111 插入 到 一 个 空 的 初始 为 可 扩散 到 数据 结构 中 的 结果 , 其 中 M 一 4. 

S05 编写 一 个 程序 实现 可 扩散 列 。 WE ENA ET EAA, 那么 它 的 性 能 与 分 离 链 托 
和 开放 定 址 散 烈 相 比 如 何 ? 
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第 6 章 EASGE) 


HOR A TE EFT EU ELOY FE hk 一 股 被 放 到 队列 中 , 但 这 未 餐 只 是 最 好 的 人 慑 法 - 例如. 可 能 有 
一 项 作业 特别 重要 ,因此 希望 上 只 鉴 打 鲁 机 一 有 空 闪 就 米 处 理 这 项 作业 eho, AEST EEL 
在 宝 时 正好 月 客 个 单 页 的 作业 及 一 更 100 页 的 作业 等 竺 打印, 则 更 合理 的 做 法 也 评 是 莽 乒 处 
AIME, 尽 符 它 不 是 最 后 提交 上 来 的 【不 理 的 是 ,大 多 数 系 统 并 木 这 么 做 ,有 时 可 能 特 
A> A titty.) 

JEM HE, EX ALP EET. BPR AS ie TEA PA ese HR. 一 
般 - -个 进程 只 能 被 允 评 运行 一 个 固定 的 时 间 片 : — PPE EEA PA, Fee Eh Re 
$i] BA S OK Fe, 调度 程序 将 芭 复 提取 队列 中 的 第 一 个 作业 并 运行 它 , 下 到 运行 完毕 或 者 该 作 
业 的 时 间 片 用 完 ， 并 在 作 烛 未 被 运行 完毕 时 把 它 亦 刘 队列 的 末尾 : Xx RP HR 一 般 开 不 太 侣 

, AA — EE TRE ERI ES REESE RES T ERKAT JIXRESS MERK, 短 的 作 
nemen nA. ik OARE 2, Ae ege TT PEDE P ore PE or EGRE DC 
HA eb. CHEF EXE mo g^ MB IE ER ER, tu RAT LSE C. 

jx Rupee RS wr ROUGE SE SE— 2S PEPPER EA PE. 我 们 称 之 为 优先 队列 (priority queue). 特别 
m. 我 们 将 讨论 

。 和 优先 队列 ADT 的 有 效 实现 。 

© 优先 队列 的 使 用 . 

。 优先 队 俐 的 高级 实现 . 
瑚 们 将 春天 的 这 类 数据 结构 属于 计算 机 村 党 中 最 讲究 物 一 客 . 


6.1 模型 


优先 队列 是 允许 至 少 下 列 了 丙种 捞 作 的 数据 结构 : Inscrr 插 入 ), "EB T TEE E rf s SLY. 

IJ A DeleteMin 删除 最 小 者 }, 759 LE Red ID ER PRODR ER DEA 91] dd 9 20 o Insert 

操作 等 价 于 Enqueue ATA), iff DeleteMin 则 是 队列 中 DequeueC 出 队 ) 在 优先 队列 [中 的 等 价 操 
ee FR eet ap pU SAA. 软件 工程 界 当 蕴 的 想法 认为 这 不 再 是 一 个 好 的 思 串 .不 [177] 

上 历史 的 原 内 我们 将 继续 使 用 这 个 丽 数 ; 许多 得 序 设计 员 期 望 DeleteMin 以 这 种 方式 


还 十 


tla] 大 多 数 数据 站 构 那 样 . 有 时 可 能 要 添加 : "ue RE. 但 这 些 添 加 的 操作 属于 扩展 的 操 
A. 而 本 属于 图 6-1 所 描述 的 某 木 模型 


—— 
| 
| 
us Insert H ; 
_ DeleredMind i | nonis Queue H A ———— 





— — 
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外 部 排序 的 - FERRE Cgreedy algerithm) 的 实现 方面 优先 队列 也 很 重要 ,该 算法 通过 反复 
求 出 最 小 元 来 进行 计算 ; 在 第 9 章 和 第 10 章 我 们 将 看 到 一 些 特殊 的 例子 。 本 章 将 介绍 优先 队 
列 在 离散 事件 模拟 中 的 一 个 应 用 . 


6.2 一 些 简 单 的 实现 


有 几 种 明显 的 方法 实现 优先 队列 。 我 们 可 以 使 用 一 个 简单 链表 在 表 头 以 O(1) 执 行 插入 
操作 , 并 遍历 该 链表 雇 删除 最 小 元 , 这 又 需要 DUON) 时 间 。 另 一 种 方法 是 , 始终 让 表 保 持 排 
序 状态 ; 这 使 得 插入 代价 商品 (OCN)}) 而 DeleteMin 花费 低廉 (DO(1)). 基于 DeleteMin RIE 
作 次 数 从 不 多 于 删除 操作 次 数 的 事实 ,因此 前 者 荡 怕 是 更 好 的 起 法 。 

青 一 种 实现 优先 队列 的 方法 是 使 用 二 叉 查 找 树 , 它 对 这 两 种 操作 的 平均 和 运行 时 间 部 起 
O(log N)。 尽 管 搬 人 是 随机 的 ， 而 删除 则 不 是 , 但 这 个 结论 还 是 成 立 的 。 记 住 我 们 删除 的 改 
一 元 素 是 最 小 元 。 反复 除去 诺 子 树 中 的 节点 似乎 损害 树 的 平衡 , PHOT. AM, A 
子 树 是 随机 的 。 在 最 坏 的 情形 , 妈 DeleteMin 将 左 子 树 删 空 的 情形 下 , 右 子 树 拥有 的 元 素 最 多 
也 就 是 它 应 具有 的 两 售 。 这 只 是 在 其 期 望 的 深度 上 加 了 一 个 小 常数 , 注意 , 通过 使 用 平衡 树 ， 
可 以 把 界 变 成 最 坏 情形 的 界 , 这 将 防 正 出 现 坏 的 插 人 序列 。 

使 用 查找 树 可 能 有 些 过 分 , 因为 它 支持 许 许 多 多 并 不 需要 的 操作 。 我 们 将 要 使 用 的 基本 
的 数据 结构 不 需要 指针 , 它 以 最 坏 情形 时 间 O(log N) 支 持 上 述 两 种 操作 。 揪 人 实际 上 将 花 
费 常数 平均 时 间 , 蔗 无 删除 干扰 ， 该 结构 的 实现 将 以 线性 时 间 建 立 一 个 具有 N 项 的 优先 队 
列 。 然后 , 我们 将 讨论 如 何 实现 优先 队列 以 支持 在 葡 的 合并 。 这 个 附加 的 操作 似乎 有 些 复 杂 ， 
它 显然 需要 使 用 指针 。 


6.3 ZN 


REEE Fd x k TEHA E (binary heap), 它 的 使 用 对 于 优先 队列 的 实现 是 如 
此 的 普遍 ， 以 至 于 当 堆 (heap) 这 个 词 不 加 修饰 地 使 用 时 一 般 都 是 指 该 数据 结构 的 这 种 实现 ， 
在 本 小 节 , 我 们 把 二 允 堆 只 叫做 堆 。 同 二 叉 查 找 树 一 样 , 堆 也 有 两 个 性 质 , 即 结构 性 和 堆 序 
VE, 正如 AVL 树 一 样 , 对 堆 的 一 次 操作 可 能 破坏 这 芮 个 性 质 中 的 一 个 , 因此 , 堆 的 操作 必须 
要 到 堆 的 所 有 性 质 都 被 满足 时 才能 终于 , 事实 上 这 并 不 难 做 到 。 

6.3.1 结构 性 质 

玲 是 一 棵 被 完全 填 满 的 二 叉 树 ， 有 可 能 的 例外 是 在 底层 , ES E 的 元 素 从 去 到 右 盾 人 。 
这 样 的 树 称 为 完全 二 灵 树 (complere binary tree}. 图 6-2 出 示 了 这 样 一 个 例子 。 

容易 证 明 , -HAA h 的 完全 二 义 树 
有 2* 到 24+  - 1 个 节点 。 这 意味 着 , 完全 
一 玉树 的 高 是 L log NI BREE 
Otlog N). 

一 项 重要 的 观察 发 现 , AAS xX 
树 很 有 规律 , 所 以 它 可 以 用 一 个 数组 表示 
而 不 需要 指针 。 图 6-3 中 的 数组 对 应 图 6-2 
中 的 堆 。 

对 于 数组 中 任 一 位 置 i 上 的 元 素 , 其 图 6.2 -ZACISK 
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左 儿 子 在 位 置 2; E, 右 儿子 在 左 儿子 后 的 单元 (2i + 1) 中 . 它 的 父亲 则 在 位 置 | i72 E E 
此 、 不 仅 指针 这 里 不 需要 ,而 晶 遍 万 该 枝 所 需要 的 操作 也 极 简单 ,在 大 部 分 计算 机 上 运行 很 
可 能 非常 快 - 这 种 实现 方法 的 惟一 问题 在 于 ,最 大 的 堆 大 小 需要 事先 合计 , 伺 对 于 典型 的 情 
况 这 并 不 成 问题 ,在 图 6-3 中 ， 玲 的 大 小 界限 是 13 TER. 该 数组 有 一 个 位 置 0; 后 而 将 详 
MEUR 











i 
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Ait, — SRE PEE TR — PRE CARR BEDE ZL). 一 个 代表 最 大 值 的 整数 
以 及 当 前 的 叭 大 小 组 成 。 图 6-4 显示 一 个 典型 的 优先 队列 声明 , 注意 与 图 3-47 中 栈 声明 的 相 
似 作 图 6-4a 创建 一 个 空 堆 ., 第 11 行将 在 后 惫 解释 。 


zifndef _BinHeap_H 
struct Heap5truct: 
typedef struct HeapStruct *PriarityQueue 


PriorityQueue Initialize( int MaxElements J; 

void Destroy( PriorityQueue H 5; 

void MakeEmpty( PrinrityQueue H }; 

void Insert( ElementType X, PriorityQueue H ); 
| ElementType DeleteMir( PriorityQueue H 5; 





ElementType FindMing PriorityQueue H 5; 
| inr IsEmpty( PriorityQueue H 5; 
int IsFullt PriorityQueue H 3}: 


| #endif 


/*" Place in implementation file */ 
struct HeapStruct 
1 

int Capacity} 

int Size; 

Elementtype *&lements; 


| 


图 4 优先 队列 的 声明 


术 音 我 们 将 始终 把 玲 画 成 树 , 这 意味 着 ,只 体 的 实现 将 使 用 简单 的 数组 。 
6.3.2 EFE 

个 操作 被 快速 执行 的 性 质 是 堆 库 (heap order) 性 .由 于 我 们 想 要 快速 地 找 出 最 小 元 , 因此 
妃 小 下 应 该 在 根 上 如果 我 们 考虑 任意 子 树 也 应 该 是 一 个 堆 , 那么 任意 节点 就 应 该 小 于 它 的 
Hit 

REDER, RATES ER W- PEN, ATA PER COR 
键 池 小 于 (或 等 于 )X PARE 根 季 点 除外 ( 它 没 有 父亲 ): ^ (EB 6-5 中 左边 的 树 是 

p 关键 字 是 整数 ， 





» Edu, ER TRI EL PRSHE— (max HE. ERI TE RE d EH PEDRO A URL E I A FA. te AGB 
BT DL HE RA coe bow, fase PERO ERE - 
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然 它们 可 能 任意 复杂 。 


PriarityQueue 
Initialize( int MaxElements 3 


PriorityQueue H; 


ift MaxElements < MinPQSize 3 
Error( "Priority queue size +5 too small" 3; 


H = malloct sizeof struct HeapStruct 3 3; 
Z" if€ H == NULL 3 
/* FatalError( "Out of space!!!" 3; 


/~ Allocate the array plus one extra for sentinel */ 
A B*/ H->Elements = malloc( C MaxElements + 1) 
* sizeof( ElementType 5 ); 
fe 7*7 if( H-»Elements == NULL } 
/* 8*/ FatalErrorí "Out of space!!!" 5; 


A ge} H->Capacity = MaxElements; 


/*lü0*/ H->5Size = Ü; 
/*11*/ H-»Elements( 0 ] = MinData; 


/812*/ return H: 





图 6-5 MSCS AA AWE) 
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M 根据 堆 序 性 质 ， 最 小 元 总 可 以 在 根 处 找到 。 内 此 , 我 们 以 常数 时 间 完 成 附加 运算 


FindMin» 
6.3.3 基本 的 堆 操 作 

AVENE LIES ESR, 执行 这 两 种 所 要 求 的 操作 都 是 容易 的 ,只 需要 始终 你 千 
堆 序 性 质 。 
Insert (4A ) 7 l 

为 将 一 个 元 素 X 插入 到 堆 中 , 我 们 在 下 一 个 空 痕 位 置 创 建 一 个 空 六 ， AS MN HENS A ESE 
全 树 。 WE 又 可 以 放 在 该 空 穴 中 而 并 不 令 坏 堆 的 序 ， 那么 插入 完成 。 BO, 我 们 把 室 灾 的 父 
节点 上 的 元 束 移 人 该 空 六 中 , 这 样 ， AH RE REA LT, BSBA SX HER 
RAST wb. 图 6-6 表示 , AHA 14, Ei HERES F— TY A PEK 由 
于 将 14 插入 空 穴 破坏 了 堆 序 性 质 , 因此 将 31 移入 该 空 闪 ,在 图 6-7 中 继续 这 种 策略 ,直到 城 
HEA 14 的 正确 位 置 。 

P UB UP ILE (porcolate up); Bsc EE Pe EC i 正确 的 位 置 。 使 用 

图 6-8 所 示 的 代码 很 容易 实现 插入 。 
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图 66 尝试 插入 4. 创建 CEN, BATA DH 





Ej 6-7 将 14 RA SIA i IARE HP] HE UNE 





/* H-»-Element[ O0 ] is a sentinel */ 


void 
Insert ElementType X, PriorityQugue H j 
{ 


iff IsFull( H } 3 
{ 
Error( "Priority queue is full" 3; 


return; 


I 


for( 1 = 4+H->size; H->klemantsi 1 Z 2 ] > Xi E f= 2) 
H->Elements{ i ] = H->Elements[ i / 2 ]; 
| H--Elements[ 1 ] = X; 
= 


PL 6-8. 搬入 到 :一个 二 义 堪 的 过 程 


其 实 我 们 本 可 以 使 用 Insert 例 程 通过 反复 实施 交换 操作 直至 建立 正确 的 序 来 实现 上 涨 过 
程 , 可 是 一 次 交换 需 旧 3 条 赋值 语句 。 如 果 一 个 元 素 上 滤 Iz. 那么 由 于 交换 而 实施 的 赋值 
的 次 数 就 达到 34 ,而 我 们 这 里 的 方法 却 只 用 d + 【次 赋值 。 

i| RS A UMA. 那么 它 将 一 直 被 推 向 顶端 : 这 样 在 某 一 时 刻 ,; 将 是 1， 
我 们 就 需要 邻 程序 跳出 while 循环 。 当 然 我 们 可 以 用 明确 的 测试 做 到 这 一 点 , 个 过 ， FETA AY 
HERD EE OO 处 以 使 while 循环 得 以 终止 。 ix fe RED TORE TD 
HE HERE: 我 们 称 之 为 标记 (sentincl}。 这 种 想法 类 似 十 链表 中 头 节 点 的 使 用 。 通过 添加 
— 07 (2 E (dummy piece of information), FR pate T PE AB BUR a, 从 面市 
省 了 一 些 时 间 ， 

刘 果 谷 插 人 的 元 素 是 新 的 最 小 元 从 而 -- 直 上 滤 到 恨 付 ， Bb Z XX RP dE ALIE BD TRE eS A 
Dtieg ND. 平均 看 来 , MRSS IEEE SS. 业已 证 明 , DU CHR ACE E 9E 2.607 次 比 


1nt 1; | 
l 


较 ， 因 此 Insert 将 元 素平 均 上 移 1.607 层 。 
DeleteMin( 删除 最 小 元 ) 

DeleteMin 以 潜伏 于 播 人 的 方式 处 理 。 找 出 最 小 元 是 容易 的 ; AEM AR RE. D 
除 一 个 最 小 元 时 , 在 报 季 点 处 产生 了 一 个 空 穴 。 由 于 现在 堆 少 了 一 个 元 素 , 因此 堆 中 最 后 一 : 
个 元 素 X DUE HRB PH. 如 果 X 可 以 被 放 到 空 穴 中 , 那么 DeletcMin 完成 。 不 
过 这 一 般 不 太 可 能 ,， 因 此 我 们 将 空 穴 的 两 个 此 子 中 较 小 者 移 人 空 从 ,这样 束 把 空 从 回 下 推 了 
一 层 。 重复 该 步骤 直到 X 可 以 被 放 人 空 守 中。 因此 , 我 们 的 和 作法 是 将 X 置信 褒 着 从 棍 开 始 包 
含 最 小 儿子 的 一 条 路 径 上 的 一 个 正确 的 位 置 。 

在 图 6-9 中 左边 的 图 显示 DeleteMin 之 前 的 堆 。 删除 13 后 , 我 们 必须 要 赴 确 地 将 31 放 到 
Ht, 3. 不 能 放 在 室 灾 中 ,因为 这 将 破坏 堆 序 性 质 。 TE, 我 们 把 较 小 的 儿子 14 BAN, 
同时 空 穴 下滑 一 层 ( 见 图 6-10)。 重复 该 过 程 , 把 19 LAC, 在 更 下 一 层 上 建立 一 个 新 的 宰 
WX. 然后 , 再 把 26 BASK, 在 底层 又 建立 一 个 新 的 空 穴 。 最 后 , 我 们 得 以 将 31 置 入 空 闪 中 
(图 6-11)。 这 种 -MARRA F i (percolate down). 在 其 实现 例 程 中 我 们 使 用 类 似 于 在 
Insert 例 程 中 用 过 的 技巧 来 避免 进行 交换 操作 - 
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图 6-0 fp AA ah eer SAC 


rex O (pdt 
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图 6-11 在 DeleieMin 中 的 最 后 两 步 
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REISER Pes Ta AEM GR SHE HEAR POLE ERST, Ee EE a Pp i B 
FH “个 儿子 的 情况 - Ei ARR AB APL. AR R9 — T- BR AU S 
it. 在 图 6-12 措 述 的 程序 中 , 我 们 已 在 第 8 行进 行 了 这 种 测试 - PR eb eR UE 
始终 保证 你 的 算法 把 每 一 个 节点 都 看 成 有 两 个 儿子 ”为 了 实施 这 种 解法 。 当 堆 的 大 小 为 偶数 
HH 于 ,在 每 个 下 小 开始 时 , 可 将 其 值 太 于 直 中 任何 元 素 的 标记 放 到 堆 的 终端 后 而 的 位 置 |。 你 
Ds EE TRB PAL CAI BIA P. mE a ER E A Sy, 虽然 这 不 再 需 
要 测试 行 儿 子 的 存在 性 , (HERR Es EU DC RT SES IZ. LALA et -REE EB 


-个 标记 。 
ElementType 
DeleteMin( PriorityQueue H ) 
1 


Int i, Child: | 
FlementType MinElement, LastElement: 


f" 1*7 if IsEmpty( H >) 3 
| { 
fe anf Error( "Priority queue is empty" j; ! 
A 3 return H-»EfTements[ 0 J; 
fe 4ef MinElement = H->Elements[ 1 ]; 
fv 5*7 LastETement = H--Flements[ H->Size-- ]; 
/* orf for( i= 1; i * 2 e= H-»5ize; i - Child ) 
i 
/* Find smaller child */ 
/* Fe Child = i * 2; 
/" B*/ ifi Child != H:»Size && H-»-Elements[ Child + i ] 
/* orf < H->Elements[ Child ? ) 
/*10*/ Chi dde; 
/* Pareolate one leve] */ 
/*ll*/ ift LastE lement > H-»Elements[ Child ] 2 
i H->Elements[ 1 | = H--Elementst Child |; 
else 


f*13*/ break ; 
1 


1 1 
/*l4*/ H-»Elements[ i ] = LastElement; 
return MinkErement; 
/*155/ MinET 
i 
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这 种 算法 的 最 坏 情 形 运行 时 间 为 O(log NO. 平均 而 言 , PACERS ICH LY Foe By 
堆 的 底层 ( 它 所 来 自 的 那 层 ),， 内 此 平均 运行 时 间 为 O Cog N). 
63.4 其 他 的 扒 操作 

注意 ,虽然 求 最 小 值 操作 可 以 在 常数 时 间 完 成 , fH ER. POR ep CI RR BE re 
小 信 堆 frmmninyhean) 在 求 最 大 元 方面 却 无 任何 帮助 . 事实 上 ， -个 堆 所 编 油 的 关于 邦 的 信息 很 
少 , 因此 , 若 不 对 整个 推进 行 线性 搜索 ， 是 没有 办 法 提出 任何 特定 的 关键 学 的 为 品 明 这 - 
ji. HER 6-13 所 示 的 天 型 堆 结构 (具体 元 素 没有 标 出 ), RAEL XE RA OR A 
道 的 惟一 信息 是 : 该 元 素 在 树叶 上 但是, 半数 的 元 素 位 于 树叶 上 ,因此 该 信息 是 没什么 用 
的 “由 上 这 个 原因 ,如 时 重要 的 是 要 知道 元 素 都 在 什么 地 方 , 那么 除 堆 之 外 , o PLUS 
如 散 列 表 等 某 些 其 他 的 数据 结构 。( 回忆 : 该 模型 并 不 允许 查看 座 内 并 

如 果 我 们 假设 通过 某 种 其 他 方法 得 知 每 -个 元 素 的 位 置 , 那么 有 几 种 其 他 的 操作 的 开销 
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将 变 小 。 下 述 三 种 这 样 的 操作 均 以 对 数 最 坏 情形 时 间 运 行 。 
DecreaseKey( 降低 关键 字 的 值 ) 

DecreaseKey( P, A, 万 ) 操 作 降 低 在 位 置 PP 处 的 关键 字 的 值 , 降 值 的 幅度 为 正 的 量 4。 由 
于 这 可 能 破坏 堆 的 序 , 因此 必须 通过 .上 泪 对 堆 进行 调整 。 该 操作 对 系统 管理 程序 是 有 用 的 : 
系统 管理 程序 能 够 使 它们 的 程序 以 最 高 的 优先 级 来 运行 。 





图 6-13 —- BREL ABB SES CU 


| 4。 mnereaseKey( 增 加 关键 字 的 值 ) 


IncreaseKey( P, A, 五 ) 操 作 增 加 在 位 置 P 处 的 关键 字 的 值 ， 增值 的 幅度 为 正 的 量 A。 这 
可 以 用 下 滤 来 完成 。 许多 调度 程序 自动 地 降低 正在 过 多 地 消耗 CPU 时 间 的 进程 的 优先 级 。 
Delete( 删除 ) 

Delete( P, H)JRAEBUERE qz EP 已 上 的 交点 。 这 通过 首先 执行 DecreaseKey CP, ©, 
H), 然后 再 执行 DeleteMin( 卢 ) 来 完成 。 当 一 个 进程 被 用 户 中 下 (而 不 是 正常 终止) 时 ,， 它 必 
须 从 优先 队列 中 除去 - 

BuildHeap( #4 EHE) 

BuildHeap( H)3&43E N 个 关键 字 作 为 输入 并 把 它们 放 人 空 堆 中 。 显 然 ， 这 可 以 使 用 N 
个 相继 的 Insert( 播 入 ) 操 作 来 完成 。 由 于 每 个 Insert 将 花费 OQ(1) 平 均 时 间 以 及 O(log NOIRS 
县 坏 情形 时 间 , 因此 该 算法 的 总 的 运行 时 间 则 是 O{ N) 平 均 时 间 而 不 是 OCUN log N) 最 坏 情 
形 时 间 。 由 于 这 是 一 种 特殊 的 指令 , 没有 其他 操作 干扰 ， 而 且 我 们 已 经 知道 该 指令 能 够 以 线 
性 平均 时 间 实 施 , 因此 , 期 望 能 够 保证 线性 时 间 界 的 考虑 是 合乎 情理 的 。 

_ 般 的 算法 是 将 N 个 关键 字 以 任意 顺序 放 人 树 中 ,保持 结构 特性 。 此 时 ， 如 采 
percolateDown(: Y B A i Pit, 那么 执行 图 6-14 中 的 该 算法 创建 一 棵 具有 堆 序 的 树 (heap- 


ordered tree) « 
for(i -N/2; i » 0; i-- ) 
FercolateDown( i 3; 









图 6-14 BuildHeap A918] BS 


图 6-15 中 的 第 一 棵 树 是 无 序 树 。 从 图 6-15 到 图 6-18 中 其 余 七 烛 树 表示 出 七 次 Percelate- 
Down 中 每 一 个 的 执行 结果 。 每 条 虚线 对 应 两 次 比较 ; 一 次 是 找 出 较 小 的 儿子 节点 , 另 一 个 十 


RAK (HE) 


将 较 小 的 儿 了 与 该 节点 比较 , 注意 , 在 整个 算法 中 只 有 10 条 虚线 {可 能 书 经 存在 第 1 A 


TERES, 对 应 20 次 比较 
RAA 
110) 


rid 
60) (50) - [4 A 


a t @ 
dadiad ag BS 


图 6-15 Ac. 初始 堆 ; A: PercolateDown(7 Y Ig 
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图 616 在 : XE PercolateDown( 6) ZR; 47: 在 Perolatel owns) 之 后 
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图 6-18 Ac: TE PercolateDownt( 2) 之 后 ; 41: f£. PercolateDown(1) 之 后 


Jy FWAR BuildHeap 的 运行 时 间 的 界 , 我 们 必须 确定 虚线 的 条 数 的 界 . 这 可 以 通过 计算 上 维 中 
所 有 节点 的 高 度 的 和 来 得 人 到, 它 尾 虚线 的 最 大 条 数 . MERMER RHE: BALA OCN). 
定理 6.1 

d 9b-l1 5 1 Pa AMA AY Be X Wf Cperfeet binary tree) 的 节点 的 E BEDS 


951. |] — {b rk 1). |187] 
证 明 : 188. 


as eat, 该 树 由 高 度 p 上 的 1 个 节点 、 向 上 度 记 一 | 上 的 2 个 节点 ,高 度 h - 2 工 的 2 个 
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节点 以 及 一 般 地 在 高 度 -i ER 个 节点 组 成 。 则 所 有 节点 的 高 麻 的 和 为 
b 
S= 220-0 
=b+2(b-1) + 4(b —- 2) + 8(h — 3) + 16054) 4... 2 Z2 (1). (6.1) 
PSE 2 得 到 方程 
28 — 2b + A(b - 1) + 8G — 2) + I6(b — 3) +... + #01) (6.2) 
MET TERRAS.) 我们 发 现 , 非常 数 项 差不多 都 消去 了 , 例如 , 26 一 2(5 
- 1) =2, 4b ~ 1) - A(b — 2) = 4, 等 等 , 方程 (6.2) 的 最 后 一 项 2 在 方程 (6.1) 中 不 出 
现 ; 因此 , 它 出 现在 方程 46.3) 中 : 方程 (6.1) 中 的 第 一 项 hp 在 方程 (6.2}) 中 不 而 现 ; 办 此， 上 
HUE 7; $8 (6.3) P. 我 们 得 到 
S=-bht+2+44 84+... +734 202 (*!—-1)- (b+ D (6.3) 
这 就 证 明了 该 定理 。 
ce 4 ft (complete tree) PEEL SUIS (perfectly binary tree), IEEE I ES SUB Ei AU 
- 棵 完全 树 的 节点 高 度 的 和 的 上 界 。 由 于 -- 棵 完全 和 树 节点 数 在 29 m 2^ cna], 因此 该 定理 意 
味 着 这 个 和 是 O(N), 其 中 N 是 节点 的 个 数 。 
虽然 我 们 得 到 的 结果 对 证 明 BuildHeap 是 线性 的 而 言 是 充分 的 , 但 是 高 度 的 和 的 界 部 不 
是 尽 可 能 的 强 。 对 于 具有 N = 2 个 节点 的 完全 笃 , 我 们 得 到 的 界 大 致 是 2N。 由 归纳 法 可 以 
W, BEDRE N 一 bON), Hob bp(N) 是 存 的 二 进 制 表示 法 中 1 的 个 数 。 


6.4 优先 队列 的 应 用 


我 们 已 经 提 到 优先 队列 如 何 用 于 操作 系统 的 设计 中 .. 在 第 9 章 , 我 们 将 看 到 优先 队列 如 何 有 
效 地 用 于 几 个 图 论 算法 的 实现 中 。 此 处 , 我 们 将 介绍 如 何 应 用 优先 队列 来 得 到 两 个 问题 的 解答 。 
6.4.1 选择 问题 

我 们 将 要 考察 的 第 一 个 问题 是 来 自 第 1 章 的 选择 问题 。 当 时 的 输入 是 N 个 元 系 以 及 一 
ARORA, SON 个 元 素 的 集 可 以 是 全 序 的 。 该 选择 问题 是 此 找 出 第 上 个 最 大 的 元 素 。 

在 第 1 章 中 给 出 了 两 个 算法 , 但 是 它们 都 不 是 很 高 效 的 算法 。 第 一 个 算法 我 们 将 称 其 为 
ij， 是 把 这 些 元 素 读 人 数组 并 将 它们 排序 , 返回 适当 的 元 素 。 假 设 使 用 的 是 简单 的 排序 算 
法 ， 则 运行 时 间 为 O(N2)。 另 一 个 算法 叫做 1 B, 是 将 上 & 个 元 素 读 入 一 个 数组 并 将 其 排序 。 
文 些 元 素 中 的 最 小 者 在 第 个 位 置 上 。 我 们 一 个 一 个 地 处 理 其 余 的 元 素 。 当 一 个 正 秦 开始 艇 
处 理 时 ,性 先 与 数组 中 第 上 个 元 素 比 较 , 如 果 该 元 素 大 , 那么 将 第 个 元 素 除 去 , 面 这 个 新 
元 过 则 被 放 在 其 余 - 1 个 元 素 间 正确 的 位 置 上 。 当 算法 结束 时 , 第 & Mi LAUR me 
问题 的 解答 . 该 方法 的 运行 时 间 为 O(N-k)。( 为 什么 ?) 如 果 =[ NA21, 那么 这 两 种 算法 
部 是 ON?) 注意 , 对 于 任意 的 ,我 们 可 以 求解 对 称 的 问题 : 找 出 第 (N -k + 1) 个 最 小 
的 元 素 , 从 而 上 = 『N/21 实 际 上 是 这 两 个 算法 的 最 困难 的 情况 。 这 刚好 也 是 最 有 趣 的 情形 ， 
国 为 上 的 这 个 值 称 为 中 人 往 孝 (median)。 

我 们 在 这 里 给 出 两 个 算法 , 在 有 = 『N721 的 极端 情形 下 它们 均 以 OCN log NIE, A 
是 明显 的 改进 。 


算法 6A 
为 了 简单 起 见 , 假设 我 们 只 考虑 找 出 第 个 最 小 的 元 素 。 该 算法 很 简单 ,我们 将 N 个 元 
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KIEA -个 数组 然后 对 该 数组 应 用 BuildHeap BE. BG. 执行 有 & X DeleeMin 操作 。 从 该 
址 最 语 提 取 的 元 这 就 是 我 们 的 党 案 . GR TEE PE, 我 们 就 可 以 求解 原始 的 门 题 ， 
Rk PEACH | 

OP BE A ak Ev iA AE PAY GS H BuldHeap. 构造 堆 的 最 坏 情 形 用 时 是 
OCN), MERR DeleteMin 用 时 Oog N) BUTS 4 TX DeleteMin. 因此 我 们 得 到 总 的 运行 时 
"P, O(N + & lg ND, UR - OCGN og ND. I AiE E ROGA F BuildHeap ete | BD 
OON) ITAR k È. 运行 时 间 为 DO(k log N) WR -[NZ2;. HA RGUT BERI 
QN log ND, 

iE. QR B = NARESH ERR AA ic eee, BARI Ke 
于 世 经 对 输入 文件 以 时间 OCN log NOE SABRE. 在 第 7 ex, 我 们 将 细 化 该 想法 , 得 到 Ae 
过 的 排序 算 读 , HU EAR BEAR Cheapsort ). 
算法 6B 

关于 第 > 个 算法 ,我 们 回 钊 原始 问题 ， 找 出 第 大 PRAM CR 我 们 使 用 算法 1B SA 
Kk ddr -时 刻 我 们 都 将 维持 夫 PRA CRRA S EET &£ TOCHKA, MPHEA - 
DEELGE, BARGE k TRAR LETIH, WRA k 个 最 大 的 元 亲 为 Si。 pg. 
eic calf A SA B TC XX UC 那么 用 新 元 素 代 芋 SIRIS 此 时 , S 将 有 一 
新 的 最 小 元 素 , EMER RS GEM OR, 也 可能 不 是 在 输入 终了 时 , RIERS S 中 最 小 
E. AUGE. CRAT. 

这 基本 上 与 第 上 章 中 描述 的 算法 相同 不 过 , xx HARÍA] -个 堆 来 实现 S. B Rk oU 
素 通过 调用 一 次 BuildHeap 以 总 时 间 口 () 被 置信 堆 中 。 好 理 每 个 其 余 的 元 素 的 时 间 为 (1) — 190 
CRW FE ETEA SEU ET TE] Otlog 在 必要 时 删除 S. SA BURR) Bt. 总 的 时 问 
E Olk + (N - blogi) = OUN log &) .该 算法 也 给 出 拷 出 中 位 数 的 时 同 界 OCN log N) 

1658 7 tt, 我 们 将 看 到 如 何以 平均 时 间 Of N) 解 决 这 个 问题 - 在 第 10 章 , 我 们 将 次 到 - 
个 以 QCN) 最 坏 情形 时 间 求 解 该 问题 的 算法， AA OS RB 
6.4.2 事件 模拟 

[3.4.3 节 我 们 描述 了 一 个 重要 的 排队 问题 . 在 那里 我 们 有 -一 个 系统 ,比如 纪行 顾客 
JEWS SERA BA EAB TE FORI & 个 出 纳 员 中 有 CELF, MESAN eE MEA Kk 
控制 .服务 时 间 ( - 旦 出 纳 员 腾 出 时 间 用 王 服 务 的 时 间 晤 ) 也 是 如 此 我 们 的 兴趣 在 二 一 位 最 
客 平 均 必 须 鉴 等 多 外 或 所 排 的 队伍 可 能 有 少 长 这 类 统计 问题 

对 于 莫 此 概率 分 布 以 及 的 一 些 值 , 答案 都 可 以 精确 地 计算 出 米 : RRB RBS SEA, 
分 析 明 并 地 变 得 困难 , 因此 使 用 计算 机 模拟 银行 的 运作 很 有 吸引 为 . 用 这 种 方法 , FRA 
可 以 确定 为 保证 合理 地 通畅 的 服务 需要 有 多少 出 纳 员 ， 

Eo d Ib Eb f EAR. RABE SEE Ca) -位 磊 客 的 人 到达, 和 (Pb) 一 位 磊 客 的 府 
di, Mais di BEN Du 

我 们 可 以 使 用 概率 函数 来 生成 一 个 输 人 人流， Em Refit EAEI TRU eee 

aL, JEJE IRB HETP. 我 们 不 必 使 用 :天 中 的 准确 时 间 ， in ef RE PATS] ht. 称 之 
为 -个 滴答 {tick) : 

der ERHERU POTERE RA ORA AERE RINER ue 

xx. I EE APRE. 如 果 有 , HE A deli 2b PE UIT, 搜集 统计 资料 : 


这 种 模拟 策略 的 问题 是 ,， 它 的 运行 时 间 不 依赖 顾客 数 或 事件 数 ( 每 位 顾客 有 两 个 事件 )， 
但 是 却 依 赖 滴答 数 , 而 后 者 实际 又 不 是 输入 的 一 部 分 . 为 了 看 清 为 什么 问题 在 于 此 , 假设 将 
钟表 的 单位 改 成 滴 管 的 于 分 之 一 {millitick) 并 将 输入 中 的 所 有 时 间 科 以 1000, M RH E: 
模拟 用 时 长 了 11000 f! 

避免 这 种 问题 的 关键 是 在 每 一 个 阶 般 让 钟表 直接 走 到 下 一 -个 事件 时 间 。 共 概念 上 看 这 古 
容易 做 到 的 。 在 任 一 时 刻 , 可 能 出 现 的 下 .一 事件 或 者 是 (a) 输 入 文件 中 下 一 顾客 的 到 达 , 或 者 
是 fb) 在 一 各 出 纳 员 处 一 位 顾客 离开 . 由 于 可 以 得 知 将 发 牛 事件 的 所 有 时 间 , A ERIE R 
找 出 最 近 的 要 发 生 的 事件 并 处 理 这 个 事件 

如 果 事 件 是 离开 , 那么 处 理 过 程 包 括 搜集 离开 的 顾客 的 统计 资料 以 及 检验 队伍 (队列 ) 看 
在 否 还 有 另外 的 顾客 在 等 待 。 如 果 有 ,那么 我 们 如 上 这 位 顾客 ,处 理 所 需 要 的 统计 和睦 料 ， 计 
SRM SCE, 并 将 离开 事件 如 到 等 等 发 生 的 事件 集中 去 。 

如 时 事件 是 到 达 , 那么 我 们 检查 闲 着 的 出 纳 员 。 如 果 没 有 , 那么 我 们 把 该 刘 达 事 件 放 到 
BEC BARI Hes 和 否则, 我 们 分 配 顾 客 一 个 出 纳 员 , 计算 顾客 的 离开 时 间 , 并 将 离 半 事件 如 
到 等 待 发 生 的 事件 集中 去 ， 

在 等 待 的 顾客 队伍 可 以 实现 为 一 个 队 讽 。 由 于 我 们 需要 找到 最 近 的 将 要 发 生 的 事件 , 合 
适 的 办 法 是 将 等 待 发 生 的 离开 的 集合 编 人 一 个 优先 队列 中 。 下 一 事件 是 下 一 个 到 达 或 下 一 个 
离开 (哪个 发 生 早 就 是 哪个 ); 它们 都 容易 达到 。 

为 覃 拟 编写 例 程 很 简单 , 但 是 可 能 很 耗费 时 间 。 如 果 有 C 个 项 客 { 因 此 有 2C 个 事件 /和 
个 出 纳 员 , 那么 模拟 的 运行 时 间 将 会 是 OUC log( + 1O, 因为 计算 和 处 理 每 个 事件 花 
费 O(log H), HHH = + 1 ARAP- 
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二 叉 堆 是 如 此 简单 ,以 至 于 它们 几乎 总 是 用 在 种 要 优先 队列 的 时 候 - dE COMER 
单 推广 , 它 怡 像 一 个 二 灵 堆 ,只 是 所 有 的 节点 都 有 d 个 儿子 (因此 , 二 叉 堆 是 2- 堆 )。 

图 6-19 表示 的 是 一 个 3- 玲 , 注意, a MEE HL OE TRA AE, 它 将 Insert 操作 的 运行 时 间 
改进 为 O{logs ND. 然而 , 对 于 大 的 d, DeleteMin 操作 费时 得 多 ， 因 为 虽然 树 浅 了 , 但 年 4 
个 儿子 中 的 最 小 者 是 必须 要 找 出 的 ,如 使 用 标准 的 算法 , 这 会 花费 4 - 1 次 比较 , 于 是 将 此 
操作 的 用 时 提高 到 Old log; N)。 如果 d 是 常数 ,那么 当然 两 种 操作 的 运行 时 间 者 是 
O(log N)。 虽 然 仍 然 可 以 使 用 一 个 数组 , 但 是 ， 现在 找 出 儿子 和 父亲 的 乘法 和 除法 都 有 个 因 
Td, 除非 a B28. 否则 将 会 大 大 地 增加 运行 时 间 ， 因为 我 们 再 不 能 通过 二 进 制 移 位 来 
空 现 除 法 了 。a- 堆 在 理 沦 上 很 有 趣 ,因为 存在 许多 算法 ,其 插入 次 数 比 DeleteMin 的 次 数 多 
很 多 (因此 理论 上 的 加 速 是 可 能 的 )。 当 优 先 队列 太太 不 能 完全 装 和 信 主 存 的 时 候 ，d- 堆 也 是 很 
右 用 的 。 在 这 种 情况 下 ，Q- 堆 能 够 以 与 B- 本 大致 相 同 的 方式 发 挥 作用 。 最 后 ， BS S, 
在 实践 中 4- MERI LAREXI — XE, 

除 不 能 执行 Find 外 , 堆 的 实现 的 最 明显 的 缺点 是 :将 两 个 堆 合 并 成 一 个 堆 基 困难 的 操 


O IH OCC log( b + Dm OCC log BOLLUR SS ko 1 AITEAL 


ABAD s 
VE. 这 种 附加 的 操作 而 做 MergeC QF). (REN BS LE AG Merge 操作 的 运行 时 间 
起 O(log N), 现在 我 们 就 来 讨论 二 种 复 来 程度 不 一 的 数据 结构 ,它们 者 有效 地 支持 Merge TR 
作 , 我 们 将 把 复 集 的 分 析 推 迟到 第 LL 草 讨论 。 
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6.6 左 式 堆 


设计 一 种 堆 结构 像 二 叉 堆 那 样 高 效 地 支持 合计 操作 { 即 以 O CN HEB] RE FE 2K Merge) rfi 
及 只 使 用 :个 数组 做 乎 很 困难 。 原 内 在 于 ,合并 似乎 需要 把 - APES -个 数组 外 
上 .对 于 相同 天 小 的 堆 这 将 花费 时 间 ON) 正 因 为 如 此 ， 所 有 支持 高 效 合 并 的 疝 级 数据 结 
构 部 需要 使 用 指针 实践 中 , 可 能 我 们 预计 这 将 使 得 所 有 其 他 的 操作 此 慢 ; SBPETRTI- MEE 
用 2 eee AIA E FE Oe TTA] o 

i — HEIE, AAH Cloftist heap) 也 具有 结构 特性 和 有 序 性 : WEL, AA TB 
ae, 去 式 堆 具 有 相同 的 玲 序 性 质 , 该 性 盾 我 们 已 经 看 到 过 ,不 仪 如 此 ， 丰 式 堆 也 是 二 又 树 。 
左 式 维和 二 丸 树 间 惟 一 的 区 别 是 ; 左 式 叭 不 是 理想 平衡 的 (pcrfectly balanced). TES as Abas 
向 于 非常 不 平衡 。 
6.6.1 ZAHEER 

我 们 把 他 一 节点 X 09:348 Y (null path length, NPL) Npl CX )g LIA, X 88. "THEE 
两 个 儿子 的 节点 的 最 短路 径 的 长 ,因此 ,具有 个 或 上 个 儿子 的 节点 的 Nb JO. 
Npi(NULL) = — 1. 在 图 6-20 的 树 中 , SRR KECE REY TA 


i e 
VPN. iN. 
1 (0) am PO) 


| CU. 


a 


4 v 


"2 of 
: 0 


6-20 PRERBEESTERE EIS. HATE GR 


注意 , 任 一 节点 的 零 路 径 长 比 它 的 诸 儿 子 节点 的 零 路 径 长 的 最 小 但 多 1 xx dT fees 
HUDF gH JL BEER. 因为 NULL FRERE- 1. 

EREEREER: 对 于 堆 中 的 每 一 个 节点 X, ELT USERS KB 5d LFS Ria IC ^ 
RE, 几 6-20 中 只 有 一 棵 树 ( 即 左边 的 那 棵 树 ) 满 是 该 性 质 。 这 个 性 质 实 际 上 超出 了 它 确保 树 人 不 


FEPER, KACA EME TERARI. 确实 有 可 能 存在 由 左 广 点 形成 的 长 路 径 

构成 的 树 (而 且 实 际 直 更 便于 合并 操作 ) 一 一 因此 , 我 们 就 有 了 去 式 礁 (leftist heap) 这 个 名 称 。 
BA Ac EGER PAL DR ZEE e. 所 以 右 路 径 应 该 短 。 ARE, 沿 左 式 堆 的 石 路 和 经 确实 是 

以 堆 中 最 短 的 路 径 。 否则 , 就 会 存在 一 条 路 从 通过 某 个 节点 区 并 取得 左 儿 子 。 此 时 和 则 破坏 


了 『 左 式 堆 的 性 质 -。 
定理 6.2 
在 右 路 径 上 在 rT ARTAR ORS A 2 - LW. 
证 有 明 ， 
数学 归纳 法 证 明 , 如 果 > = 1, 则 必然 至 少 存 在 一 个 树 节点 。 另 外 , 设 定理 对 1、2,，...、 


r 个 节点 成 立 。 考虑 在 右 路 径 上 有 + 1 个 节点 的 左 式 树 。 此 时 , 根 具 有 在 右 路 径 工 会 了 个 
特点 的 右 子 树 , 以 及 在 右 路 径 上 至 少 全 > 个 节点 的 左 子 树 ( 和 否则 它 就 不 是 左 式 树 )。 对 这 两 条 
子 树 应 用 归纳 假设 , 得 知 在 每 标 子 树 上 上 最少 有 2' 一 1 个 节点 , PEU ERR, 于 是 在 该 树 上 
至 少 有 2- 1 个 节点 , BE. 

从 这 个 定理 立刻 得 到 ，N 个 节点 的 左 式 树 有 一 条 右 路 径 晤 多 含有 Llog ON E) VIP RECS 
左 式 堆 操 作 的 一 般 思 路 是 将 所 有 的 工作 放 到 右 路 径 上 进行 ， 它 保证 树 深 短 。 惟一 的 棘手 部 分 企 
T, AFTARA Insert 和 Merge 可 能 会 破坏 左 式 堆 性 质 , SEXE E, 恢复 该 性 质 是 非常 容易 的 。 
6.6.2 左 式 堆 的 操作 

对 左 式 崔 的 基本 操作 是 合并 , 注意 , 搬 人 只 是 合并 的 特殊 情形 ,因为 我 们 可 以 把 所 人 看 
成 是 单 节点 堆 与 一 个 太 的 堆 的 Merge. 首先 , 我 们 给 出 一 个 简单 的 递归 解法 , 然后 介绍 如 何 
能 够 非 递 妇 地 施行 该 解法 。 我 们 的 输入 是 两 个 左 式 堆 Hi 和 Ho. 见 图 6-21。 HA CIE, 
xe Mn c EHE, 注意, 最 小 的 元 素 在 根 处 。 队 数据 、 左 指针 和 右 指针 所 用 空间 外 , 每 个 
单 扰 还 要 有 一 全 指示 零 路 径 长 的 项 - 





图 6-21 两 个 左 式 堆 A, HH; 


如 果 这 两 个 堆 中 有 一 个 堆 是 空 的 , 那么 我 们 可 以 返回 另 外 -个 堆 。 和 否则, 为 了 合并 这 两 
ME, 我 们 需要 比较 它们 的 根 。 BIG. 我 们 将 具有 大 的 根 值 的 堆 与 具有 小 的 根 值 的 堆 的 太子 
堆 合 并 ， 在 本 例 中 , 我 们 递归 地 将 H; 与 H 中 根 在 8 处 的 丰 子 堆 合并 , 得 到 图 6-22 中 的 堆 。 

由 于 这 棵 树 是 递归 地 形成 的 ， 而 我 们 尚 末 对 算法 措 述 完毕 因此 ， 我 们 现在 还 不 能 说 明 
Me ETRE). 不 过 , 有 理由 假设 , 最 后 的 结果 是 一 榜 左 式 淮 ， 因为 它 优 通过 递归 的 步 
PRIE AE BA. FSC TBR ISAS HEAR P A UPA Ti E o FSR (| 18E ERE BA EE CA "E (E ERE 
TE BH MR), ESR AT EM, EESTI TLTAE2 7E Jp DRACO S za 
3, 我 们 在 第 1 章 中 讨论 过 它 。 现在, 我 们 让 这 个 新 的 堆 成 为 Hi Fs ptr LT COLES 6-23). 


4£ HA PI (38 ) 
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图 6-23 Hi 接 上 图 622 中 的 左 式 堆 作 为 右 儿 了 的 结 乐 


虽然 最 后 得 到 的 堆 满足 玲 序 性 质 , 但 是 , 它 不 是 左 式 堆 , 因为 根 的 左 子 树 的 零 路 径 攻 为 i 
而 根 的 右 子 树 的 零 路 径 长 为 2。 因此, 左 式 的 性 质 在 根 处 被 人 破坏。 不过， 容易 看 到 , 树 的 其 余部 
分 必然 是 左 式 的 。 由 于 递归 步骤 , BHAT BAR, 根 的 左 子 树 没有 变化 ,当然 七 也 必然 还 
是 去 式 的 。 这样 一 来 , 我 们 只 要 对 根 进行 调整 就 可 以 了 . 使 整个 树 是 左 式 的 做 法 如 下 : 只 要 交换 
根 的 左 儿 子 和 右 儿子 (图 6-24) 并 更 新 零 路 径 长 , 就 完成 了 Meme, 新 的 零 路 径 长 是 新 的 右 儿 子 
的 零 路 径 长 加 1。 注意 , 如 果 零 路 径 长 不 更 新 , EZ BUG DUAE RETE aE 0, SBR} Ae TE 
的 ,只 是 随机 的 。 在 这 种 情况 下 ,等 法 仍然 成 立 , 但 是 , 我 们 宣称 的 时 间 界 将 不 再 有效。 





图 6-24 ”交换 Hi 的 根 的 儿子 得 到 的 结 素 


8 


Hee BTA EERIE RRS. ATE Np SRE K) ao}, 算法 中 的 类 型 定义 ! 图 
6-25) 与 二 叉 树 是 相 则 的 . 我 们 在 第 4 音 已 经 看 到 ， 当 一 个 元 素 被 插入 到 一 棵 空 的 二 叉 树 时 ， 
需要 改变 指向 根 的 指针 。 最 容易 的 实现 方法 是 让 桂 人 例 程 返回 指向 新 树 的 指针 , TERT ES, 
这 将 使 得 左 式 堆 的 Insert $M HEAY Insert 不 兼容 (后 者 什么 也 不 返回 )。 图 6-25 的 最 后 一 行 
描述 了 捍 脱 这 种 窘境 的 一 种 方法 .。 返回 新 树 的 堪 式 堆 播 人 例 程 将 记 为 Insertl; E Insert 将 完 
MK Go MERA ARE, 这 种 使 用 宏 的 方法 可 能 不 是 最 好 和 最 安全 的 做 法 , 但 为 一 
种 方法 即 把 PriorityQueue 声明 为 指向 TreeNode KISS. RUE RA TRU RES. 


#ifndef _LeftHeap_H 


struct TreeNode; 
typedef struct TreeNode *PriorityQueug; 


/* Minimal set of priority queue operations */ 

/* Note that nodes will be shared among several */ 
/* leftist heaps after a merge; the user must */ 
/* make sure to not use the old leftist heaps */ 


PriorityQueue Initialize( void 3; 

ElementType FindMin€ PriorityQueue H J; 

int IsEmpty( PriorityQueue H }; 

PriorityQueue Merge( PriorityQueue H1, PriorityQueue H2 5; 


#define Insert X, HY C H = Inserti (X 2, H 3 2 
/* DeleteMin macro 7s left as an exercise */ 


PriorityQueue Insertl( Elementlype X, PriorityQueue H ); 
PriorityQueue DeleteMinl( PriorityQueue H ); 


s endi f 


/* Place in implementation File */ 
struct freeNode 
1 


ElementType Element; 
PriorityQueue Left; 
PriorityQueue Right; 
int Mpt; 





图 6-25 | ACRES 


因为 Insert -TEF REONE HUBER, AEA Insert 的 例 程 必须 能 够 允 
到 安定 义 ,图 6.25 为 一 个 典型 的 头 文件 , 将 宏 声 明 放 在 那里 是 惟一 合适 的 办 法 。 后 面 将 会 看 
到 ,DeleteMin 也 需要 写成 宏 的 形式 。 
合并 操作 的 例 程 (图 6-26) 是 一 个 被 设计 成 除去 一 些 特殊 情形 并 保证 H, A BUTS R 
例 程 。 实 际 的 合并 操作 在 Mergel 中 进行 (图 6-27). 注意 , 原始 的 两 个 左 式 堆 绝 不 要 再 使 用 ; 
它们 本 身 的 变化 将 影响 合并 操作 的 结果 ， 
搞 行 合并 的 时 间 与 右 路 径 的 长 的 和 成 正比 , 因为 在 递归 调用 期 间 对 每 一 个 被 访问 的 六 点 
执行 的 是 常数 工作 量 。 因此 , 我 们 得 到 合并 两 个 左 式 堆 的 时 间 界 为 O(log ND. 我 们 也 可 以 分 
两 超 来 非 递 归 她 实施 该 操作 。 在 第 一 趟 , 我 们 通过 合并 两 个 堆 的 右 路 径 建 立 一 覃 新 的 树 ,为 
此 , 我 们 以 排序 的 顺序 安排 HR HRS EU, 保持 它们 各 自 的 左 几 子 不 变 . 在 我 们 


197 
c -ATT BER HO HC AES 6 8 UB RR ES POR 


££ EBA BY (JR ) 149 
EMTT., SEPA 3, 6, 7, 8, 18, MAREE A ES 6-28 中 . 35 ae he BLAME, 
儿 下 的 交换 工作 在 看 式 堆 性 质 被 破坏 的 那些 告 点 下 进行 - 在 网 6-28 "B, 在 节点 7 和 3 有 -次 
变换 ， 并 得 到 与 前面 相同 的 树 : 韭 递 归 的 做 法 忠 容 易 理解 , 但 编程 困难 。 我 们 留 给 读者 INE 
WY 递归 这 程 和 和 非 递 归 讨 程 的 结果 是 相隔 的 


一 


PrioriryQueue 
Merged PriorityQueue Hl, PriorityQueue H2 ) | 


poss ifC H1 == NULL ) 


j^ 2*f return H?; 
A if H2 == MULI 5 
1 fv dt if return Hl; 
f* SS, iff Hi-»Element < H2--Element 3 
| f* "F return Mergel( Hi, H2 3; 
else 
/* Ff return Mergel( H2, Hl 3; 


[] 6-26 AJ ERIE R SHITE 
MEME 


static PriorityQueug 

Mergel( PriorityQueue H1, PriorityQueue H2 ) | 
i 
A l*/ iff Hl-»Left -= NULL 3 /* Single node */ | 


l 
PP LH Hi-»Left = H2; /* Hi->Right is already NULL, 
| Hl--Npl is already Ù */ 
| else | 
{ 1 
| ft 3*/ H1->Right = Merge( Hl--Right, H2 }; i 
fe arf ift HL eLeft-aNpl < Hi-sRight->Npl 7 | 
| JE SE SuapChildren£ H1 3}; 
| /* By Hi-»Npl = Hl1-»Right-»Npl + 1; | 
! 
让 return Hil; 


图 6-27 AH UE ag sc DTE 
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图 .28 SHH, HH HERE 


二 而 提 到 ,我 们 村 以 通过 把 被 插入 项 看 成 单 节点 堆 并 执行 -- 次 Merge 来 完成 插入 。 为 了 
HAS DeleteMin, FL B REI dL GEBURT TOR, 然后 再 将 这 两 个 堆 合并 。 因此, 执行 一 次 
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DeleteMin 的 时 间 为 O(log N)。 这 两 个 例 程 在 图 6-29 利 图 6-30 中 给 出 。 DeleteMin 可 以 写成 
E., 它 调用 DeleteMinl 和 FindMin. 我 们 把 它 留 作 读 者 的 一 道 练习 题 。 





PriortrtyQueue 
Inserti¢ ElementType X, PriorityQueue H ) 
| 


PriorityQueue 5ingleNode; 


/* 1*7 SingleNode = malloc( sizeof( struct TreeNode J >; 
| f* 2*/ if( SingleNode == NULL ) 
/* 3*/ FatalError( "Out of space!!!" 5; 
else 
{ 
/* 4*/ SingleNode->Element = X; SingleNode-»Npl = 9; 
f* SR SingleNode->Left = SingleNode->Right = NULL; 
| /8 Bry H = Merge( SingleNode, H ); 
} 
| f/* F*/ return H; 
i 


图 629 FORE A 


/* DeleteMinl returns the new tree; */ 
/* Ta get the minimum, use FindMin */ 
/* This is for convenience */ 


DeleteMinl( PriorityQueue H 3 


PriorityQugue 
PriorityQueue LeftHeap, RightHeap; 
l 


f* i*/ if¢ IsEmpty( H 2 2 
ft a*r | Error( "Priority queue is empty" 3; 
/* 3*/ return H; 
} 
| /* g*r LeftHeap = H-»Left; 
f/* 5*/ RightHeap = H--Right; 
A 6*/ free( H j; 
y^ ?*/ return Merge( LeftHeap, RightHeap j; 


F 





Ei6-30 左 式 堆 的 DeleteMin 例 程 


最 后 , 我 们 可 以 通过 建立 一 个 二 叉 堆 (显然 用 指针 实现 ) 而 以 O(N) 时 间 建 立 一 个 左 式 
Kt. 尽管 二 叉 堆 显然 是 左 式 的 , 但 它 未 必 是 最 住 解决 方案 , 因为 我 们 得 到 的 堆 可 能 是 最 差 的 
Fe AE. 不 仅 如 此 ,以 相反 的 层 序 遍 历 树 也 不 像 用 指针 那么 容易 。BuildHeap 的 效果 可 以 通过 
递归 地 建立 左右 子 树 然 后 将 根 下 滤 而 得 到 。 练习 中 包括 另外 一 个 解决 方案 。 


6.7 HË 


SHE (skew heap) 是 左 式 堆 的 自 调节 形式 , 实现 起 来 极其 简单 。 斜 堆 和 左 式 堆 间 的 关系 类 
似 于 伸展 树 和 AVL 笃 间 的 关系 。 gi E E MEER BS CUBE, 但 是 不 存在 对 树 的 结构 限制 。 不 
IET AXE, 关于 任意 节点 的 零 路 径 长 的 任何 信息 都 不 保留 。 斜 堆 的 右 路 径 在 任何 时 刻 部 可 
以 任意 长 , 因此 , 所 有 操作 的 最 环 情形 运行 时 间 均 为 O(N). 然而 , iE AD IR] fH REI RE. 可 以 
证 明 ( 见 第 11 章 ) 任 意 M 次 连续 操作 , 总 的 最 环 情形 运行 时 间 是 OM log N) 因此 , 和 斜 堆 每 
次 操作 的 摊 还 时 间 (amortized cost) 为 O(log N)« 


AFI CB) 5 

要 在 式 扒 相同 , 糙 堆 的 基本 操作 也 是 合并 操作 : 这 个 Merge 例 往 还 是 递归 的 , 我 们 执行 
与 以 前 完全 相册 的 操作 ,但 有 一 个 例外 ,， 即 : FELE, dI] i eO AL FRAIL 
足 左 式 堆 堆 序 性 质 并 交换 那些 不 满足 该 性 质 者 : 但 对 于 和 斜 堆 ， 除 了 这 些 有 路 答 上 所 有 有 HADI 
晤 大 者 不 交换 它们 的 左右 儿子 外 ,交换 是 无 条 件 的 - 这 个 俩 让 就 是 在 自然 通 归 实现 时 所 发 生 
的 现象 , 因此 它 实 际 上 根本 不 是 特 中 人 情形- 不 仪 如 此 ， 污 明 时 辣 界 也 是 小 必要 的 , 但 是 ,出 于 


该 节点 肯定 没有 右 儿子 , AIRE AR. CORINA SE, wa ILE, 因此 [198 


我 们 椒 必 为 此 担心 。) 男 外 , UFR A IE I BOE, SLES 6-31. 





ef x 
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BUR REE Hz 5 Hu PRE AR 4 么 我 们 将 得 但 图 6-32 PRE. 


CI B 
S TA 
f 3 / 3 - 
"i jas Ke CDS. 
Mul VL "i Lu -— 
^ 1 
x _? 
kc. ` 
Is | f|: ， £ i] 
Mou NE u 
Ae 
24 


图 6-32 E H. E H, 的 看 子 堆 合 并 的 结案 


这 也 是 递归 地 完成 的 , 因此, 根据 递归 的 第 二 个 法 则 (所 1.3 节 ) 我 们 不 必 担 心 它 基 如 何 
得 名 和 的。 这 个 堆 碰 巧 是 左 式 的 ,不 过 不 能 保证 情况 总 是 如 此 。 我 们 使 这 个 堆 成 为 H 的 新 的 
AJL, 而 H, 的 老 的 左 儿 子 变 成 了 新 的 在 儿 疗 ( 见 图 6-33). 

整个 树 是 左 式 的 , 但 是 宁 易 看 到 这 并 不 总 是 成 立 的 : 将 15 横 人 到 新 堆 中 将 破坏 左 式 性 质 ， 

我 们 也 可 像 左 式 座 那样 非 递归 地 进行 所 有 的 操作 : 合并 右 路 径 , 除 最 后 的 节点 外 父 换 右 
路 径 上 每 个 节点 的 左 儿 子 和 右 儿子 。 经 过 几 个 例子 之 后 ， SRA ia: m PER ENT 
于 最 后 的 站点 外 的 所 有 节点 都 将 它们 的 儿子 交换 , 因此 最 终 效 采 让 EUR TRH AREAS 

Tat AO DEG E CLA C «co IL OH TREE K jb TEE. 
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区 6-33 GHEHE H AH, 的 结果 


斜 堆 的 实现 留 作 练 习 。 ER, 因为 右 路 径 可 能 很 长 , 所 以 递归 实现 可 能 由 于 缺乏 栈 空 间 
而 失败 ， 昌 然 在 其 他 方面 性 能 是 可 接受 的 。 斜 堆 有 一 个 优点 ， 即 不 需要 附加 的 空间 来 保 备 路 
径 长 以 及 不 需要 测试 确定 何 时 交换 儿子 。 精 确 确 定 左 式 堆 和 斜 堆 的 期 望 的 右 路 径 长 是 一 个 疝 
本 解决 的 问题 (后 者 无 疑 更 为 困难 )。 这 样 的 比较 将 蝎 容易 确定 半 衡 信息 的 轻微 址 失 是 合 可 由 
缺少 测试 来 补偿 。 
6.8 二 项 队列 


虽然 堪 式 堆 和 斜 堆 每 次 操作 花费 O(log N) 时 间 , 这 有 效 地 支持 了 合并 . AM 
DeleteMin, 但 还 是 有 改进 的 余地 ， 因 为 我 们 知道 , 二 义 堆 以 每 次 操作 花费 常数 半 均 时 间 支 持 
A, 二 项 队列 支持 所 有 这 三 种 操作 , 每 次 操作 的 最 坏 情形 运行 时 间 为 O(log N), mind Ad 
作 平 均 花 费 常 数 时 间 。 
6.8.1 二 项 队列 结构 

二 项 队列 (binomial queue) 不 同 主 我 们 已 经 看 到 的 所 有 优先 队列 的 实现 之 处 在 于 ,一 个 二 项 
队列 不 是 一 棵 堆 序 的 树 ， 而 是 堆 序 树 的 集合 ， 称 为 春 林 (ferest)。 堆 序 树 中 的 每 一 栋 部 是 有 约束 
的 形式 , 叫做 二 项 树 (binomial tree, 后 面 将 看 到 该 名 称 的 由 来 是 显然 的 )。 TROUPE ILES 
在 一 栋 二 项 树 。 高 度 为 0 的 二 项 笃 是 一 棵 单 节点 树 ; 高 度 为 & 的 二 项 树 B 通过 将 一 棵 二 项 本 
Bo- | 附 接 到 另 一 棵 二 项 树 BB _ ART. 图 6- 34 显示 二 项 树 Bo, Bo Ba Bs 以 及 Bio 


ur 


B, 


Fl 6-34 二 项 树 Bs. Bis Bo. B3 PAR Bag 
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MEHEL BIB, 由 - -个 带 有 儿子 B Bis... Bie UAB. AEA EU] LO 
树 恰 好 有 有 25 个 基点 ,而 存 深度 4 处 的 节点 数 是 -项 系数 | |. 如 果 我 们 把 堆 序 施 加 到 一 项 树 


上 并 允许 任意 高 度 上 最 多 有 一: 棵 二 项 树 ， 那 么 我 们 能 镶 用 一 项 树 的 集合 惟 :地 表示 任意 大 小 
的 优先 队列 例如， 大 小 为 13 的 优先 队列 可 以 用 森林 B3, Ba, Bo Bon. RITI SUR E 
TER 1101, 它 不 仪 以 二 进 制 表示 了 13, MADARA ASE: TE LIRR, Bs, Bz, 
By 出 更, 而 p, WRA. 

作为 一 个 例子 , 六 个 无 素 的 优先 队 人 多 可 以 表示 为 图 6-35 中 的 形状 。 
6.8.2 二 项 队列 操作 

此 时 , 万 小 元 可 以 通过 搜索 所 有 的 树 的 根来 找 出 由 于 最 多 有 log N 棵 不 同 的 树 ， 内 此 
最 小 二 可 以 时 间 OUog N) 找 到 。 另 外 , 如 果 我 们 记 住 当 最 小 元 在 其 他 操作 期 间 灾 化 时 更 新 
qz. 那么 我 们 也 可 保 角 最 小 元 的 信息 并 以 OOTATE - 

合并 其 个 二 项 队列 的 操作 在 概念 上 是 容易 的 操作 ,我们 将 递 过 例子 描述 。 考虑 两 个 一 项 
MSH ADA, 它们 分 别 上 共有 六 个 和 七 个 元 素 ， 见 图 6- 36。 

合并 操作 基本 上 是 通过 将 两 个 队列 加 到 一 起 来 完成 的 - 令 Hy 是 新 的 二 项 队列 - A A, 
没有 高 度 为 0 的 二 项 树 而 HO. 因此 我 们 就 用 五 - 中 高 度 为 0 的 二 项 树 作为 Ha 的 一 部 分 。 
然后 ,我 们 将 两 个 高 度 为 1 的 二 项 树 相 加 - 由 于 万; AA, 都 有 高 度 为 1 的 二 项 树 ， 因 此 我 们 
可 以 将 它们 全 并, 让 大 的 根 成 为 小 的 根 的 子 树 ， 从 而 建立 高 伐 为 过 的 二 项 树 ， 见 图 6-37, 这 
样 ，H; 将 没有 高 度 为 1 的 二 项 树 . 现在 存在 三 襟 高 度 为 2 的 一 项 树 , 即 H, 和 Ho 原 有 的 两 
个 一 项 树 以 及 由 上 一 步 形 成 的 一 栋 一 项 和 峙 . 我 们 将 一 标高 度 为 2 的 二 项 树 放 到 Hy P. 并 个 
{LAM POO, 得 到 一 棵 高 度 为 3 的 .项 树 . 由 于 Ha, 和 Ho 部 没有 高 度 为 3 的 二 项 树 ， 
因此 该 二 项 树 就 成 为 H 的 一 部 分 ,合并 结束 . 最 后 得 到 的 二 项 队列 如 图 6-38 所 水 。 
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图 638 JR Hy, SH, WA, 的 结束 
由 于 几乎 使 用 任意 合理 的 实现 方法 合并 是 棵 一 项 树 均 花费 常数 时 间 ， 而 总 共 仓 在 
Oog N) 棵 二 项 树 ， 因此 合并 在 最 坏 情形 下 花费 时 间 O(log N)。 Xd iM PR GEAR. 我 们 
a: sag xc reb gc e as Reg SEA rp, 当然 这 做 起 来 是 件 催 单 的 事情 。 
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插入 实际 上 就 是 特殊 情形 的 合并 , 我 们 只 要 创建 一 棵 单 节点 树 并 执行 一 次 合并 。 这 种 操 
作 的 最 坏 情 形 运 行 时 间 也 是 O(log N). 更 准确 地 说 ,如 果 元 素 将 要 插入 的 那个 优先 队列 中 
不 存在 的 最 小 的 二 项 树 是 B, 那么 运行 时 间 与 i+1 成 正比 。 例如 , ACA 6-38) RR EON 
1 的 二 项 树 , 因此 插入 将 进行 两 步 而 终止 。 由 于 二 项 队列 中 的 每 棵 树 出 现 的 概率 均 为 17 2, 
于 是 我 们 期 望 插入 在 两 步 后 终止 , 因此 , 平均 时 间 是 常数 。 不 仅 如 此 , 分 析 将 指出 , 对 一 个 初 
始 为 空 的 二 项 队列 进行 N 次 Insert 将 花费 的 最 坏 和 情形 时 间 为 O(N)。 事实 上 , 只 用 N - 1 
次 比较 就 有 可 能 进行 该 操作 ; 我 们 把 它 留 作 练 习 。 

作为 一 个 例 于 , 我 们 用 图 6-39 到 图 6-45 演示 通过 依 序 插入 1 到 7 来 构成 一 个 二 项 队列 。 
4 的 插入 展现 一 种 坏 的 情形 。 我 们 把 4 与 Bo 合并 , 得 到 一 棵 新 的 高 度 为 1 的 树 。 然 后 将 该 树 
与 B, 合并 , 得 到 一 标高 度 为 2 的 树 , 它 是 新 的 优先 队列 。 我 们 把 这 些 算 作 三 步 ( 两 次 树 合并 
加 上 终止 情形 ), 在 插入 7 以 后 的 下 一 次 插入 又 是 一 个 坏 情形 , 需要 三 次 树 合并 操作 。 


> A 2% 


图 6-39 在 1 插入 之 后 图 640 在 2 插入 之 后 图 5-41 在 3 插 人 之 后 图 6-42 在 4 捅 人 之 后 


BEA" 


图 6-43 在 5 插入 之 后 图 6-44 在 6 插入 之 后 6-45 ETAZ 


DclcteMin 可 以 通过 首先 找 出 一 棵 具有 最 小 根 的 二 项 树 来 完成 。 令 该 树 为 Bo 并 令 原 妨 
的 优先 队列 为 H, 我 们 从 H 的 树 的 森林 中 除去 二 项 树 BL, 形成 新 的 二 项 树 队 列 H 。 再 除去 
B, 的 根 , 得 到 一 些 二 项 树 By, By, ..., Be -它们 共同 形成 优先 趴 列 H^» OP HAA, 
操作 结束 。 

作为 例子 , 设 对 Ha 执行 一 次 DeleteMin, 它 在 图 6-46 中 表示 。 最 小 的 根 是 12, 因此 我 们 
得 到 图 6-47 和 图 6-48 中 的 两 个 优先 队列 HOR. AS 和 地 得 到 的 二 项 队列 是 最 后 的 
答案 , 见 图 6-49 所 示 。 





图 6-46 二 项 队列 H 
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图 6.47 CTAN H, SBR Bs 外 H 中 所 有 的 二 项 树 图 6-48 二 项 队列 H: 除去 12/88) B; 
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图 6-49 Delere Mint H3 2] 2d 


为 了 分 析 ， 首先 注意 ，DeletcMin 操 件 将 原 二 项 队列 一 分 为 二 。 3E UB US Ie CORREA 
创建 队列 Hn H^ fS] TB] O Clog N)。 合并 这 两 个 队列 又 花费 O(log Nomplal, 内 此 , 整个 
DeleteMin 操作 花费 时 间 O Clog N). 

6.8.3 二 项 队列 的 实现 

DeleteMin 操作 需要 快速 找 击 根 的 所 有 子 树 的 能 力 ， 因此 , FRA HE RS 
每 个 节点 的 弟子 都 存在 -个 链表 中 , 而 且 每 个 节点 都 有 一 个 指向 它 的 第 一 个 儿子 (如 采 有 的 
话 ) 的 指针 . 该 操作 还 要 炒 : 诸 儿 子 按照 它们 的 子 树 的 大 小 排 译 ,我 们 也 寡 此 保证 能 够 很 容 易 
地 合并 画 标 树 ， 当 两 棵 树 被 侣 并 时 ， 其 中 的 一 棵 树 作 为 儿子 被 加 到 另 一 棵 树 上 .. d Fix BU 
树 将 是 最 大 的 子 树 . 因此 ,以 大 小 递减 的 方式 保持 这 些 子 树 是 有 意义 的 - 只 有 这 时 ,我们 才 
能 够 有 效 好 合并 两 棵 “二 项 树 众 而 合并 两 个 二 项 队列 . 二 项 队列 将 是 二 项 全 的 数 织 ， 

BS: 二 项 树 的 每 一 个 节点 将 包含 数据 、 第 一 个 几 子 以 及 在 兄弟 。 二 蔗 酝 中 的 语 儿 六 以 
3B WX HP BEA; 

图 6-51 解释 如 何 表示 图 6-50 路 的 二 项 队列 。 图 6-52 显示 :项 树 中 的 节点 的 类 型 声明 - 


"IO (23) (12) 
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6-5] UTA) H, 的 表示 方式 


为 了 合并 两 个 二 项 队列 , RAS PARRA HATA ORT, 图 6-53 指出 
两 个 二 项 树 合 并 时 指针 是 如 何 变 化 的 。 合并 二 项 树 的 程序 很 简单 ， 见 图 6-54. 

现在 我 们 介绍 Merge 例 程 的 简单 实现 。 该 例 程 将 Hi 和 Ho 合共， 把 合并 结果 放 入 Hy 
rh. FON Hy. 在 任意 时 刻 我 们 在 处 理 的 是 牧 为 i 的 那些 树 。Ti M T 分 别 是 H 和 H 中 
的 树 . mi Carry 是 从 上 一 步 得 来 的 树 ( 可 能 是 NULLO. UR T, ftit, WAL! Ted. 


IH eee HOF 


Mt! T, #20, 对 其 余 的 树 也 是 如 此 . SRA i 以 及 秩 为 i + 1 的 Carry 树 所 得 到 的 结果 形 
成 的 树 ， 其 形成 过 程 依 赖 于 8 和 神 可 能 情形 中 的 每 一 种 。 该 过 程 从 牧人 间 开始 到 产生 三 项 队 介 的 
最 后 的 秩 。 程序 见 图 6-55. 

二 项 队列 的 DelereMin 例 程 在 图 6-56 中 给 出 

当 受 到 影响 的 元 素 的 位 置 已 知 时 , 我 们 可 以 将 二 项 队列 扩展 到 冯 持 二 叉 堆 了 所 允许 的 某 些 
非 标准 的 操作 , 诸如 DecreaseKey 和 Delete, DecreaseKey 是 一 次 PercolateUp, RFRA 
个 城 加 到 每 个 节点 上 指向 上 其 父亲 , 那么 PercolateUp 可 以 时 间 Oog NN}) 完 成 ,一 次 任意 的 
Delete 可 以 通过 DecreaseKey 和 DeleteMin 以 时 间 O Clog N) 结 合 而 完成 。 


typedef struct BinMode *Fosition; 
typedef struct Collection *BinQueue; 


struct BinNode 
{ 


ElementType Element; 
Position LeftChi 1d; 
Position NextSibling; 


H 


struct Callection 
{ 
int CurrentSize; 
BinTree TheTrees[ MaxTrees ]; 





} 


6-52 二 项 队列 类 型 声明 
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图 6-S3 合并 两 棵 二 项 树 


/* Return the result of merging equal-sized T1 and T2 */ 


BinTree 
CombineTrees( Bintree TL, Bintree T2 j 


i 


if€ Tl-»Element > T2--Element ) 
return CombineTrees¢ T2, T1 }; 

T2->NextSibling = T1->Laftchiid; 

Ti-»LeftChild = T2; 

return T1; 





图 6-54 合并 同样 天 小 的 两 棵 二 项 树 的 例 程 


f£ HPA FU (38 ) 


Imm 
| /* Merge two binomial queues */ 


/* Not optimized for early termination */ 
/* Hi contains merged result */ 


Bi nQueue 

Merge( BinQueue H1, BinQueue He ) 

1 
Bintree Ti, TZ, Carry = NLLL; 
int i, j; 


iff Hi-»CurrentSize + He-»CurrentSize > Capacity 2 
Error( "Merge would exceed capacity" ); 


Hi->CurrantSize += HM2-»Currentáiize, 
for( i = 0, 1 = 1; j <= Hi-sCurrentSize; 14+, j *= 2 3 


| 
| 
| 
| 
Ti = H1->TheTrees[ i ]; T2 = H2-»TheTrees, i ]; | 


l 
switchi !!Tl + 2 lIT2 + 4 * Hidarry 了 
i 
case D: /* ho trees */ 
case 1: /* Only Hi */ 
break: 
case 2; /* Only H2 */ 
Hl-»Thefrees[ i ] = Tz; 
H?-»IheTreesí à ] = MULL; 
break; 
case 4; /* Only Carry */ 
H1-»TheTrees[ i ] = Carry; 
Carry = NULL; 
break; 
case 3: /* Hl and H2 */ 
Carry = ComhbineTrees( TI, T2 ); 
Hi->Thelrees{ i ] = H2-»TheTrees[ 1 1 = NULL; j 
break: 
Case 5: /* Hl and Carry */ 
Carry = CombineTrees( T1, Carry 3 
| Hi-»TheTrees[ à ] = MULL; | 
break; 
case b: /* H2 and Carry */ | 
| Carry = CombineTrees( 12, Carry ); | 
nz-»TheTrees[ 1 ] = NULL; 
break; 
| case 7: /* All three */ 
i Hl-»TheTrees[ i ] = Carry; 
Carry = Combinetrees{ Tl, TZ M 
H2-»TheTrees[ i ] = NULL; 
break; 
t 
return Hl; 





图 6-55 合并 两 个 优先 队列 的 俩 在 
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| ElementType 
DeleteMint BinQueue H } 


i 





int i, 33 

int Mintree; /* The tree with the minimum item */ 
BinQueue DeletedQueve; 

Position DeletedTree, OldRoot; 

E'ementType MinItem; 


if( IsEmpty H 2 2 
1 


Error( "Empty binomial queue" ); 
return -Infinity; 


1 


MinItem = Infinity; 
fort i= Q: d < MaxIrees; i++ 1 
{ 
ift H-»TheTrees[ i ] && 
H-»TheTreest i ]-»£lement < Minltem ) 
i 
/* Update minimum */ 
Minitem = H-»ihnejrees; 1 ] ->Element; 
MinTree = i; 
} 
} 


DeletedTree = H-»TheTrees[ MinTree ]; 
OidRoot = DeletedTree; 

DeletedTree = DeletedTree->LeftChild; 
freet OldRoot 3; 


DeletedQueue = Initialize( ); 
DeletedQueue-»CurrentSize = ( 1 << MinTree j - 1; 
for( j = MinTree - 1; j x= 0; je- D 


DeletedOueue-»TheTrees[ j ] = DeletedTree; 
DeletedTree = DeletedTree-»NextSibling; 
DeletedQueue-»TheTrees[ j ]->NextSibling = NULL; 


} 


H-»TheTrees[ MinTree ] = NULL; 
H->Current$ize -= DeletedQueue--CurrentSize + 1; 






Merge( H, DeletedQueue ); 
return Minltem; 


图 6-56 一 项 队列 的 DeleteMin 


总 结 


在 这 一 章 , 我 们 已 经 看 到 优先 队列 ADT 的 各 种 实现 方法 和 用 途 。 WHEN RHE H 
于 箱 单 和 速度 快 从 而 是 精致 的 。 它 不 需要 指针 ， 只 需要 常数 的 附加 空间 ,， 且 有 效 支 持 优先 队 
SABRE 

我 们 考虑 了 另外 的 合并 操作 , 发 展 了 三 种 实现 方法 , 每 种 都 有 其 独到 之 处 。 左 式 堆 古 弟 
归 强 大 力量 的 完美 实例 。 斜 堆 则 是 代表 缺少 平衡 原则 的 一 种 重要 的 数据 结构 。 它 的 分 林 是 有 
sho. 我们 将 在 第 11 章 进 行 。 二 项 队列 表明 ,如 何 用 一 个 简单 的 想法 来 达到 好 的 时 间 界 。 

我 们 还 看 到 优先 队列 的 几 个 用 途 , 从 操作 系统 的 工作 调度 到 模拟 。 我 们 将 在 第 7、9 和 10 


章 肯 次 看 到 它们 的 应 用 。 
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练习 


cn 


.1 设 我 们 用 FindMin 替换 DeleteMin BR «SEE Insert 各 操作 FindMin 部 能 以 常数 时 
[P] Sc RS ? 
2 a. 写 出 一 次 一 个 地 将 10, 12, 1. 14.6.5. 8,15, 3,9, 7, 4, 11, 13 02 fi ACRI 
一 个 初始 为 空 的 二 丸 堆 中 的 结果 。 
b. 号 出 使 用 相同 的 输入 通过 线性 时 间 算 法 建立 一 个 二 叉 中 的 靖 来 。 
6.3” 写 出 在 上 向 练习 的 堆 中 执行 3 次 DeleteMin 操作 的 结束 。 
6.4 编写 在 二 叉 堆 中 进行 上 滤 的 例 程 和 进行 下 滤 的 例 程 
.5 写 出 并 测 成 -个 在 二 六 堆 中 执行 Insert. DeleteMin, BuildHeap. FindMin, DecreaseKey, 
Delete 和 [ncreaseKey 等 操作 的 程序 。 
.6 在 图 6-13 BEATAE RU Ro n a? 
7 a. 证 有 明 对 于 - ‘ 叉 堆 ,BuildHeap BY FETCH 2N - 2 ERIE. 
b. TEAR 8 个 元 素 的 堆 可 以 道 过 堆 志 素 间 的 8 次 比较 构成 . 
cs 给 出 一 个 算法 ， EN + O(log NTE RHEE .个 一 又 堆 。 
(46.8. 证 明 , 在 一 个 大 的 完全 推 (你 可 以 假设 N = 2* 一 1) 中 第 个 最 小 元 的 期 绷 深 度 以 
log k A. 
Ora. BH PEW — VHP DEEPA X MAPA. 你 的 算法 应 该 以 
OK 8%, Hob, K 是 答 出 的 节点 数 。 
b. 你 的 算法 可 以 扩展 到 本 童 讨论 过 的 任何 其 他 堆 结 网 吗 ? 
we. SMB, ERE BN IA 次 比较 找 出 二 叉 堆 中 任意 的 项 X : 
. .6 10 提出 - .个 算法 ,用 OUM + log N loglogN) 时 间 将 M 个 节点 插 人 刘 六 (GRE. 
HEX, LEW PREETI A. 
6.11 编写 一 个 程序 输入 N 个 元 素 并 
a. HEM PHAR TE. 
b. 以 线性 时 间 建 立 一 个 堆 。 
比较 这 两 个 算法 对 于 已 排序 、 反 序 以 及 隧 机 输入 的 运行 时 间 ， 
6.12. fi DeleteMin 操作 在 最 坏 情 形 下 使 用 2log N UC EERE. 
xa. HEM — BHA 3E TS DeleteMin 操作 只 使 用 log N + logiog N t OC? ial 
的 比较 ,。 这 未 必 意 味 着 较 少 的 数据 移动 。 
eb. 扩展 你 在 (a) 部 分 中 的 方案 使 得 内 执行 log N 1 loglogiog N + OCL) KERR. 
、<¢， 和 你 能 够 把 这 种 想法 推 加 多 还” 
d. 在 比较 中 节省 下 来 的 开销 能 天 补偿 你 的 算法 增加 的 复 菏 性? 
6.13. 如果 - -个 忆 堆 作为 一 个 数组 存储 , 那么 对 位 于 位 置 : 的 项 ,其 父 亲 和 儿 子 部 在 哪里 ? 
6.14 设 一 个 未 堆 初始 时 有 个 元 素 , 而 我 们 需 监 对 其 执行 M 次 PercolateUp Fl N 次 
DeleteMin. 
a. AMON 和 4 表示 的 所 有 操作 的 总 的 运行 时 间 是 多 少 ? 
b. 如果 d = 2, 所 有 的 堆 操 作 的 运行 时 间 是 多 少 ” 
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6.16 
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c. 如 果 d = O(N), 总 的 运行 时 间 是 多 少 ? 
«d. 对 d 作 什 么 选择 将 最 小 化 总 的 运行 时 间 ? 
最 小 一 最 大 堆 (min-max heap) 是 支持 两 种 操作 DeleteMin 和 DeleteMax 的 数据 结 
H, 每 个 操作 用 时 O(log N)。 该 结构 与 二 叉 堆 相同 , 不 过 ,其 堆 序 性 质 为 : 对 于 
在 偶数 深度 上 的 任意 节点 X, FHE 芒 上 的 关键 字 小 于 它 的 父亲 但 是 大 于 它 的 棚 
父 ( 这 是 有 意义 的 ), 对 于 奇数 深度 上 的 任意 节点 X, FAE X 上 的 关键 字 大 于 它 
的 父亲 但 是 小 于 它 的 祖父 ， 风 图 6-57. 
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图 6-57 最 小 -最 大 堆 


a. 我 们 如 何 找到 最 小 元 和 最 大 元 ? 
«b. 给 出 一 个 算法 将 一 个 新 节点 插入 到 该 最 小 -最 大 堆 中 。 
«c. 给 出 一 个 算法 执行 DeleteMin 和 DeleteMax. 
xd. 你 能 否 以 线性 时 间 建 立 一 个 最 小 一 最 大 堆 ? 
.e， 设 我 们 想 要 支持 操作 DelereMin, DeleteMax 以 及 Merge. 提出 一 种 数据 结构 以 
时 间 O(log N) 支 持 所 有 的 操作 : 
合并 图 6-58 中 的 两 个 左 式 堆 。 





图 6.58 


写 出 依 序 将 关键 字 1 到 15 插入 一 个 初始 为 空 的 左 式 堆 中 的 结果 。 

证 明 下 述 结论 成 立 或 不 成 立 : 如 果 将 关键 字 1 到 25 . 1 依 序 插入 到 一 个 初始 为 空 
的 去 式 堆 中 , 那么 结果 形成 一 棵 理想 平衡 柄 (perftectiy balanced tree) 。 

给 出 一 个 生成 最 佳 左 式 堆 的 输入 的 例子 。 

a. 左 式 堆 能 否 有 效 地 支持 DecreaseKey? 

b. 完成 该 功能 需要 哪些 塞 化 (如 果 可 能 的 话 )? 


££ E EA FI (AB) 161 

6.2) MARE —P LU Ai ERD A P,P — x. 
EUE ME HPCE HRN. 24 fT  PFindMin 或 DeleteMin BY. dig UR T 
ERNEUTE -ARAR A APEC TS) ERU SE Br M EL SR EK SE E 
的 最 小 元 ,这 可 能 涉及 伸 删 除 其 他 一 些 已 做 标记 的 节点 。 在 该 三 法 由，Delere 化 费 
一 个 单位 , 但 一 次 DeleteMin 或 FindMin 的 开销 却 依赖 于 被 做 删除 标记 的 等 总 的 
个 数 . 设 在 - -次 DeleteMin 或 FindMin 后 全 标记 的 节点 比 操作 前 少 了 下 个 . 
-a. DEP EN OC log N)BJIEHAT DeleteMin. 213 

^o b. 提出 一 种 实现 方法 ,通过 分 析 证 骨 执 行 PeleteMin 的 时 间 为 OC log (N78). »" 

6.22 我 们 可 以 以 线性 时 间 对 左 式 堆 执 行 BuildHeap 操作 :; FP MANES SRA 
OE, 把 所 有 这 些 堆 放 到 一 个 队列 中 之 后 , 让 两 个 堆 出 队 . 人 台 并 它们 , BEREGOUT 
ARAA, 直到 队列 中 只 有 一 个 堆 为 止 - 
a. WEAR ERA ERI BO OCN): 
b. 为 什么 该 算法 优 于 课文 中 描述 的 算法 ? 

6.23 合并 图 6.58 PRI BLE. 

6.24 写 出 将 关键 字 1 到 15 KARAS REN IIHR, 

6.25 证明 下 述 结论 成 立 或 不 成 立 : 如 果 将 关键 字 1 到 2* -- 114 38, A 80— Pin i Az 
的 射 堆 中 , 那么 结果 形成 -…- 棵 理想 平衡 树 (perfectly balanced tree). 

6.26 ”使 用 标准 的 二 叉 堆 算法 可 以 建立 一 个 N PCR MRE. 我 们 能 理 将 练 半 6.22 中 
描述 的 同样 的 人 台 并 方法 用 于 斜 堆 而 得 到 O (NOS fT Ayla? 

6.27 证明 二 项 树 B, EAT WIT BS, Bi oo’ Be 1 作为 其 根 的 儿 闻 . 


. Å anon 
6.28 证 明 高 度 为 上 的 一 项 树 在 深度 过 有 | NS 
6.29 将 图 6-59 出 的 两 个 一 项 队列 合并 ， 
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6.30 a. TEAR: 向 初始 为 空 的 二 项 队列 进行 N 次 Insert 最 坏 情 形 下 的 运行 时 间 为 


O(N); 
1， 给 出 一 个 算法 来 建立 有 N AUCH MORO, 在 泡 素 问 最 多 使 用 六 1 次 比 
9 


«c. IB CERE, 以 O(M + log N 最 坏 情形 运行 时 间 将 M 个 节点 插入 到 NN 个 
元 内 的 二 项 队列 中 ; uEBRÁRES E. 
6.31 写 出 一 个 有 效 的 例 程 使 用 二 项 队列 来 完成 Insert PRAE, 不 要 调用 Merge. 


162 BOE 
6.32 SFA: 
a， 当 调用 Merge(H, HORE EAE E A o 修改 代码 以 修正 该 问题 。 
b. 如 果 在 FI; PRAHE PA Carry 树 为 NULL, ER Merge 鲍 程 以 终止 合并 。 
c. 修改 Merge 使 得 较 小 的 树 总 被 合并 到 较 大 的 树 中 。 
«*6.33 假设 我 们 将 二 项 队列 扩充 为 允许 每 个 结构 至 多 有 两 棵 相同 高 度 的 树 - 我 们 能 否 在 
其 他 操作 保留 为 O(log NN) 时 实现 最 坏人 情形 时 间 为 OCT) BUTEA? 
6.34 设 有 许多 盒子 , 每 个 盒子 都 能 容纳 总 重量 CHI i, iz igs e iy, 它们 分 别 
Bow), we, wa, sss Who 现在 想 要 把 所 有 的 物品 包装 起 来 , 但 任 一 盒子 部 不 能 
放置 超过 其 容量 的 重 物 , 而 且 要 使 用 尽量 少 的 合子, 例如 , C-5, 物品 分 别 重 
2, 2, 3, 3, 则 我 们 可 用 两 个 盒子 解决 该 问题 。 
一 般 说 来 , 这 个 问题 很 难 , 没有 已 知 的 有 效 的 解决 方法 。 编 写 一 个 程序 , 有 效 
地 实现 下 列 各 近似 策 赂 : 
ra. 将 物品 放 人 能 够 承受 其 重量 的 第 一 个 盒子 内 (如 果 没 有 盒子 拥有 足 人 驶 的 容量 网 
开辟 一 个 新 的 合子)。( 该 策略 以 及 后 而 所 有 的 策略 都 将 得 出 3 个 盒子 , 这 不 是 
最 优 的 结果 。 ) 
b. 把 物品 放 人 对 其 有 最 大 容量 的 盒子 内 。 
«c. 把 物品 放 入 能 够 容纳 下 它 而 又 不 过 载 的 装填 得 最 满 的 盒子 中 。 
«xd. 这 些 策 上 略 中 有 通过 将 物品 按 重 量 预先 排序 而 功能 得 到 增强 的 吗 ? 
6.35 BRIER KHE DecreaseAllKeys(A) 添 加 到 堆 的 指令 系统 中 去 。 该 操作 的 结果 是 
” 堆 中 所 有 的 关键 字 都 将 它们 的 值 减少 量 A。 对 于 你 所 选择 的 堆 的 实现 方法 , 解释 所 
做 的 必要 的 收 改 , 使 得 所 有 其 他 操作 都 保持 它们 的 运行 时 间 而 DecreaseAllKeys 以 
O{ 所 运行 。 
6.36 ”这 两 个 选择 算法 中 哪个 具有 里 好 的 时 间 界 ? 
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7:9 HR 序 


这 一 FRAP AEE CRR e AT CO EPR PA BB RH 
Mii eR AE. HOA ES eZ Ag ae PA RD ERY) | RPA RAPA A, 我 们 还 假设 莹 个 
HHY ARES fe ETE SER. 因此 , oo BY RO ee heheh po^) PSR, 不 能 在 主 
PER ERE A v CE TA SL ake Eear bg BRR Ge EA HE APh A ea pvp AE ox- 
terval sorting } DEC pu «i AFE i iTe. 

Ae TSE SEHR IPIE ARE 

e diie ILERA E HIERE OCNTMREIT , UHA AGE 

e (1 RR B Ar HET CShellsort) . t 5fe3E' 简单， Pl ol naig., HAER PE 

SES 

e {p---e RE ORE SEE OCN dog NOBSHHE HRS IE. 

e iT fs FAY BERR LEE GUN log NUR ELA 

1S HARB HG ZETA HEAL: 这 些 算法 包含 一 些 有 趣 的 和 重要 的 代码 优 
化 和 多 法 设计 思想 ”可 以 对 排序 做 出 精确 的 分 析 ， 孤 先 说 明 ， 在 迁 当 的 时 扔 .我们 将 尽 可 能 
ii a (ie eor. 


7.1 预备 知识 


Faq GARR AY BGR ay ETAT. PTL HE PA CRY Pe a 
IER CC EE 

FRIE N GEER AEE BUR HCE POR. Ec eee, AGAIN. Fe 
HEC Age ae ott PTA RAE. Xf AEE ELO 处 开始 

Tec <A > ui ERES. 它们 可 以 用 于 将 相 容 的 序 放 人 到 输入 中 ， 除 赋值 运算 
符 外 ， 这 两 种 运算 是 公有 的 允许 对 输入 数据 进行 的 操作 。 在 这 些 茶 件 下 的 排序 叫 德 基于 化 园 


VPE C miparison- hased sorting). 


7.2. 插入 排序 


7.2.1 算法 

报 阶 单 的 排序 算法 之 一 第 插入 排序 finsertion sort) - 所 入 排序 由 NC 1 i Cpass) HF IL 
WoO EP 1 eh P N- 1 未 ,插入 排序 保证 从 位 置 0 SUPE VE PoC A PAS. 
iG HLS RI) PixféBUdew. 位 置 6 到 位 置 P- 1 LAR RELI. 图 7-1 显示 一 个 
ft np ME -iih A EFE HIS UR - 

5 7.] &Kik T--RRBg2;15 ER P BA, NA^ HE P RACHA Baa (ERT P-IT^ 
pu" -图 7.2 中 的 程序 实现 该 想法 : 532 行 到 第 5 T ELCHE EE m c ERU] E 
Whee. CORP EMDURIT Tap. MEME P x HD 4 A AIRERA (T 
(ch ORG Dap 被 置 二 正确 的 位 置 上 上- 这 种 方法 HEA eT ET HB BTE 25 Fifa] - 
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i} 
1 
3 
4 
7-1 每 不 后 的 搬入 排 序 
mI 
| void 
| InsertionSort( ElementType AL ], int N 3 
| int 1, P; 
Element Type Tmp; 
ft 1s for( P = 1; P « N; Pe 3 
| 
fe 2*/ Tmp = ALP]; 
/* 3*/ forl j= P; j > 0 && AL j - 11 > Tmp; j-- 5 
f* 4*/ A[ j J] = ALJ - 1); 
| f* 55) AL } ] = imn; 


[E] 7.2 AHT RE 





7.2.2 插入 排序 的 分 析 

出 于 报 套 循环 的 每 一 个 都 花费 N 次 送 代 , 因此 插入 排序 为 O(N?). 而 旦 这 个 办 是 精确 
的 ,因为 以 反 序 输入 订 以 达到 该 界 。 精确 计算 指出 对 于 了 的 每 个 值 , 第 4 行 的 测试 最 多 执 
P+R. SHB PORTU, 得 到 总 数 为 


Ni =24+31+4+...4N = OCN?) 
男 ai, 如 果 给 入 数据 已 预先 排序 , 那么 运行 时 间 为 ON). 因为 内 层 for BEES EMI 
是 立即 判定 不 成 立 而 终止 。 事 实 上 ， 如 果 输 人 几乎 镍 排序 (该 术语 将 在 下 一 节 更 产 格 地 定义 )， 
堵 么 插 人 排序 将 运行 得 很 快 。 由 于 这 种 变化 差别 很 大 ,因此 值得 我 们 去 分 析 该 算法 平均 情形 的 
行为 。 实 际 上 , 和 各 种 其 他 排序 算法 一 样 , 插 人 排序 的 平均 情形 也 是 GUN, 详 见 下 节 的 分 析 。 


7.3 ”一些 简单 排序 算法 的 下 始 


成 员 存 数 的 数组 的 . -个 道 序 (inversion) 是 指数 组 中 其 有 性 质 i<7 BAL] > 站 | 站 的 序 
BOCA], AL Ds TEE HABIT B. 输入 数据 34, 8, 64, 51, 32, 21 有 9 个 道 序 ， 节 (34， 
8). (34, 32), (34, 21), (64, 51), (64, 32), (64, 21), (51, 32), (51, 21) 以 及 (32, 21). 
prt. 这 正好 是 需要 由 插 人 排序 ( 非 直接 ) 执 行 的 交换 次 数 . 情况 总 是 这 样 ， 因为 交换 其 个 不 
控 闵 序 排 询 的 相 邻 元 素 欠 好 消 除 一 个 逆序 ， 而 一 个 大 过 序 的 数组 没有 北 序 。 由 于 算法 中 还 有 
OCN BUR BR TAE, 因此 插 人 排序 的 运行 时 间 是 OU +N}, 其 中 了 为 原始 数组 中 的 逆序 
数 ， 于 是 , 若 道 序数 是 ON), 则 插入 排序 以 线性 时 间 运 行 。 

我 们 可 以 通过 计算 排列 中 的 平均 泛 序 数 而 得 出 搬入 排序 平均 运行 时 间 的 精确 的 乔 、 tt 
常 一 样 , 定义 平均 是 一 个 困难 的 命题 。 我 们 将 假设 不 存在 重复 元 素 ( 和 如 果 我 们 允许 重复 ， 那 
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A WeYGEMCEIBRREGU€R[ÍABRIE) Rcg. PR ea ASHESdEN T 
t RCA T REP CDS A HT OPM Y de SE SO SR AA PES aT EE TRE 
这 下、 我 们 有 如 下 定理 : 


定理 7. 
N 个 下 异 数 的 数组 的 平均 逆序 数 是 NAN - DAL. 
证 明 : 


Mt PLR L. PERF LEP Ay ab 21. 32. 5b. 64. 8,34 # 
iA ALE RRA 0. Hv > 显然 , EEL AIL, SH -0 BEER 
— Site ER L B'EBISCHEAXL, OPW PRA NON -1)° 2 因此 , PI RAR 
n9 of, BINEN — DA T XI 

XP FE ACHE EEE TRA. Te te EA ee oe RE EU - 
TREAD T FF 


定理 7.2 
通过 交换 相 邻 匹 素 进行 排序 的 任 柯 算法 平均 需 归 只 CN) 时间 
WEAF : 


WARREN EET NON - DA = MN). 而 等 次 交换 只 减少 一 个 逆序 . 因此 需要 
O(N" RRB 

这 是 计 明 下 办 的 - -个 例子 , E TII EEA Ra EC REGERE SCC e I) S6 TR Bddr ACHE 17 a. 而 
Hou i ARE AHUT UTERE E TAE TE f — 1€ f] "PORE AE th RB CO. DEER PEI fL TRE S pax 
BE. SCE, 它 对 一 整 类 只 进行 相 邻 元 素 的 交换 的 排 厅 算法 . tLe SEES RO 
ih. RARE UM TAA adh, 这 个 证 明太 经 验 上 是 不 能 被 认可 的 BAR P AED HEAL AP 
党 简单 . 但 是 ARE HHP ARSE LT pL 98 EESIE. 

这 个 下 界 告 沂 我 们 ， 为 了 使 一 个 排 厅 算 法 以 业 — IX Csubquadratic) Bk of No falie dr, on 
须 拟 行 - PELE AE. 特别 昌 对 相 另 绞 远 的 元 来 进行 交 反 一 个 排 字 算法 通过 删除 道 序 得 以 向 前 
进行 ,而 为 了 了 有效 地 运行 , 它 区 须 每 深交 换 删 陈 不 止 一 个 逆序 - 


7.4 项 尔 排序 


ABE, hellsort MP FELT EB ALAA A Donald Shell . PASE A LE aR RT ded e 
的 第 一 批 算 法 之 -. 不 过 , 和 白 从 它 最 初 被 发 现 . XGIY A MFS TU P Y OBI 
(an Pe MERAY. 它 道 过 比较 相距 -守则 隔 的 元 未 来 工作 ; 6e ELLERPEPTHT UOTE ERA RC I 
航 进 行 而 减 小 , EDAD E BSc is AHT k. 由 于 这 个 诛 内 ， 和 水 排 厅 有 只 也 
叫做 缩小 增 莫 排序 (dinmiinishing increment sort) 

杀 尔 排 说 使 用 一 -个 序列 A. Ao, 000 A, IRGI APF] (increment sequence) WISE A= Litt 
(pm EF SARE Uap AD. 不过, redd EL bg El RIR EA 
个 问题 )， 在 合用 增 基 a 的 一 趟 排序 之 后 ， 对 于 每 -- 个 我 们 有 和 iba Aio A, GRE 
Ee Lm 所 有 相隔 AL 的 元 素 邦 被 排序 JE ES XC E Ar HEAR CAS sone INT. UE ru 
T3 显示 在 各 趟 排序 后 数组 的 情况 ， 硕 尔 排 序 的 - T RETERE GERI RSEN PA) RS. c 
Shy ARE GS SOE OR SEE A, 排序 的 ?保持 它 的 让 排序 性 .事实 下, fattii t Het FF 


ty 
rt 


的 证 、 脏 么 该 算法 也 就 没什么 意 久 了， 因为 将 向 各 峭 排 序 的 线 打 就 会 被 语 而 各 档 排 于 





| 
e| 


"aul 








| 在 | MOOD gp 28 12 41 %5 15 9% 35 8l 94 g4 V 
| 4 和 -排序 后 ， n 12 tl 35 18 41 SB 17 44 73 81 96 33 | 
在 1- 排 序 后 12 15 id^ 28 35 41 Sh 735 HT 94 95 96 





图 7-3 RHET REEL FS S PO 


-排序 的 一 般 做 车 是 , 对 于 h hi td... NOL PRP. 把 其 上 的 元 素 放 
到 7 一 各 ,2 中间 的 正确 位 置 上 : 虽然 这 并 不 影响 最 终 续 CR. Hae ff ne E 

—& A, 一 排序 的 作用 就 是 对 A, 个 独立 的 了 数组 执行 一 次 插入 排序 SETTE a A as 
序 的 运行 时 闻 时 , 这 个 考查 结果 将 中 很 重要 的 

增 量 序列 的 一 种 流行 (但 是 不 好 ) 的 选择 是 使 用 Shell 建议 的 序列 : A, 7| NY 2 IATA, = 
Lanai? 21H 7-4 er —^ fe RAI RM RY. J RAT BP FAE cum 
增 的 序列 , EVD ABA ot RT SEE BOE; 即便 是 一 个 小 的 改变 剧本 能 剧烈 好 
影 吓 着 算法 的 性 能 ( 见 练 习 7. 10) 

图 7-4 中 的 程序 以 与 我 们 在 播 和 人 排序 实现 方法 中 相同 的 方式 避免 明显 地 使 用 交换: 





void 
Shellsertt ElementType AL J. int N 2 
int i, J, Increment; 
ElamentType Imp; 
A le fort Increment = N / 2; Increment > 0; Increment /= 2 } 


ft l*r for( i = Increment; à < M; ie } 
| | 
| f= 3*/ Tmp = AE d j: 
f[* 4*5j fort j = 4; j >= Increment; j -- Increment + 
fe nj if( Tmp < A( 7 - Increment ] ) 
/* o*r AL 3 ] =A j - Increment 1; 


I 


MEN i 


Pel 7-4 GRR ABESSE DE CIEE GERARD 


7.4.1 希 尔 排序 的 最 坏 情形 分 桥 

TRARRE, 但 是 ,其 运行 时 间 的 分 析 则 完全 是 另外 一 回 事 . Ar ASHE IY Bux 
yest (eae Fe RAEE, E WEN AT HE A TERES 希 尔 排序 的 平均 情形 分 析 . BR ROP TU 
的 一 些 增 量 序 列 外 , 是 一 个 长 期 未 解决 的 问题 . 我 们 将 证 明 在 两 个 特别 的 增 晤 序列 下 最 坏 悄 


TE Imp me m As 
EHE 7.3 
(di FT ee ae Ee A a O Nv). 
iE AA : 


HEA) ALA 8 UE JB T REPRE a ij AEM TER PAR EME 
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一 一 一 — — — 1a c- 一 


HOON NSIT. 首先 通过 构造 :个 坏 情 霹 来 证 明 下 界 、 我 们 先 选择 N RR BE. 这 使 
得 除 最 后 NER 1 外 所 人 的 增 量 部 是 倘 数 .现在 ,我们 给 出 一 个 数组 InpurDanta 作为 输 
入 它 的 偶数 位 置 上 有 N/A2 个 问 是 最 大 的 数 , 而 在 奇 数位 置 上 有 NA2 个 同 为 最 小 的 数 ( 对 
Wig], 第 一 个 位 置 是 位 置 门 ， 由 于 除 最 后 一 个 增 量 外 所 有 的 增 些 部 是 偶数 ,因此 ， 当 我 们 
进行 最 后 -… 趟 排序 前 ,NA 2 个 最 天 的 元 素 仍 然 处 在 偶数 售 置 上 , 而 N7 2 个 最 小 的 无 素 也 还 
是 在 奇数 位 晤 下。 于是、 在 最 后 一 趟 排序 开始 之 前 第 ; 个 最 小 的 数 {i 所 N/A2) 在 位 轩 2i- 1 
LO 将 第 个 元素 属 复 到 此 让 确 位 是 党 要 在 数组 中 移动 : -1 个 间隔 。 这样 , 仅 仪 将 NY 2 
个 最 小 的 元 素 放 到 正确 的 位 置 上 就 需要 至 少 S10; 一 1 = QUND 的 工作 ， 作 为 一 个 例子 ， 
I] T-8 los :个 =16 时 的 故 ( 但 不 足 最 直 ) 的 输入 在 2- 排序 后 的 逆序 数 一 于 怡 好 保持 为 
1-243-4-5:1647-—28; 因此 , 最 后 一 趟 排序 将 花费 相当 多 的 时 间 ， 

现在 我 们 证 明 上 界 OK N2) 以 结束 本 证 明 、 前 而 已 经 观察 到 , 带 有 增 量 LBS gH HU 
hy TEFEN 个 元 素 的 搬入 排序 组 成 ， 由 于 插入 排序 是 二 次 的 ,因此 一 目 排 序 总 的 片 销 奉 


On UNZRYO = OUNT hg) 对 所 有 各 趟 排序 求 和 则 给 出 总 的 界 为 OC NS UNT) - 
OCNT 、 IZh) 内 为 这 些 增 量 形成 一 个 几何 级 数 , 其 公 比 为 2, 而 该 级 数 中 的 最 太 项 二 
k =. A, ST. ,17h, « 2. 于是. 我 们 得 到 总 的 界 ON’). 












poa e 

1 FË | 19 2 10 3 11 à 5 8 

| 在 8 排序 后 | 1 3 7 10 3 11 4 12? 35 t 4 
;在 4 排序 二 1192 00 3 0 4 92 5 143 8 le | 
在 1 排序 后 | 1 9 2 0 3 11 4 12 3 13 6 14 7 15 $8 16 | 

| 1 2 3 4 5 å 7 > FO 11 142 14 J4 15 lé | 





在 EHE 





图 7-5 有 具有 项 尔 增 昌 的 希 尔 排 序 的 坏 情 形 ( 位 置 编号 从 1 到 16) 


希 尔 增 量 的 问题 在 于 , 这些 增 量 对 未 必 互 素 , 因此 较 小 的 增 基 可 能 影 啊 很 小 Hibbard 
pip —4 BY pm aod E EE. 它 在 实践 中 (并 日 理论 上 ) 给 出 更 好 的 结束 :他 的 增 世 形 如 | 
3.7... 22- 1 虽然 这 些 增 量 几乎 号 相同 的 , 但 关键 的 区 别 是 相 邻 的 增 量 没有 公 因 于 : 
其 在 我 们 号 来 分 析 使 用 这 个 增 基 序列 的 希 尔 排 序 的 最 坏 情 形 和 运行 时 间 , 这 个 证 明 相 当 复 水 ， 

定理 7.4 

使 用 Hibbard 增 量 的 希 尔 排序 的 最 坏 情 形 运 行 时 间 为 ON? 7). 

证 明 : 

我 们 HEB EH mH F FB ur BH 留 必 练习 ， ix “PE BH ae SEHE Ae iE l additive number the- 
ory) HIER TAS. ARERR T. Ea RBS SA 

lay hi. GE. AFEA, FRET RA AE 3s TTT PA FE ERROR A, 
qaae Ay > N! :的 增 基 , 我 们 将 使 用 前 -~ 定 肆 得 到 的 界 ON Zh.) 号 然 这 个 办 对 于 其 他 
增 量 也 是 成 立 的 . 但是 它 太 大 , HTL. EWEA. 我 们 必须 利用 这 个 增 量 序列 是 特殊 的 这 
样 -个 午 实 ”我 们 需要 证 明 的 是 ,对 于 位 置 P 上 的 任意 抑 素 Ap. SEAT Ah, BERE, LUT 
>t GE GER PHALA TAr- 

要 对 输 人 数组 进行 Ap 排序 时 , 我 们 知道 它 已 经 息 hp, HEZA ea HET TE Ae 
HELL. SER 和 PP 一 7 上 的 两 个 元 素 , 其 中 IP. WIR i Thap. IE A AYRIK, Hi 


170 #7 
么 显然 A[P - i| « ALP]. 不 仪 如 此 ， MR TWA, AA, REAR G CL dE f d 
数 的 上 形式}, 那么 也 有 ALP iix APIS Bj, SREE 3- REPEAT, X PEU ERE 7-3] 
序 和 15- 排序 的 了 52]ELE A 7 ALIS 的 线性 组 合 : 52 = 1X7 + 3x15. FA, A110014 
可 能 大 于 A'152], AA A[T00; LAT E07 ISA] 221 A [137 17 A [ 152]. 

dé. his; 72h, "E l, 因此 h, Al hk. SC A SEN. TEX 文 种 情形 下 ， 可 以 证 明 , 至 少 
HOi DO (Apo) EBA + 4; 一样 大 的 所 有 整数 都 可 以 表 为 和-.: 的 线性 组 合 
{ 见 本 章 末 尾 的 参考 文献 ),， 

这 就 告诉 我 们 , 第 4 行 的 for HEPAT EN — A, 位 置 上 的 告 “个 .最 多 执行 8h + 4 
=OCA ) 深 。 于 是 我 们 得 刘 每 霄 的 宰 O Nh) a 

利用 大 约 一 半 的 增 妈 满足 A, <v 只 的 事实 并 假设 上 是 偶数 ,那么 总 的 运行 时 间 为 

o( 3M, + SN NU) = ONS ha tN Yu ha) 


点 一 上 + sA- 


内 为 两 个 和 部 是 几何 级 数 ， 3840 4,5; = OCW N), 所 以 上 式 简 化 为 


= O(Nh, 5^) + olg :J- OCGN??) 


使 用 Hibbard FER BOE RHEE As frm T8] Ade TRU RA O (N77), 4i 
是 没有 人 人 能够 证 明 该 结果 。Pratt 已 经 证 明 , OCNCCO BS GERITI UZ ey 

Sedgewick 提出 了 几 种 增 景 序列 ,其 最 坏 情形 运行 时 间 ( 也 是 可 以 达到 的 ) 为 OCN S). 
对 和 于 这 些 增 量 序列 的 平均 运行 时 间 猜 测 为 OCNT )。 经 验 研 客 指出， eI UT rie 
行 要 比 Hibbard 的 好 得 多 , 其 中 最 好 的 是 序列 11.S,， 19, 41，109 , 该 序列 中 的 项 或 者 是 
Qep e Get 1, 或 者 是 于 一 3: 22 t 1, 通过 将 这 些 值 放 到 一 oath OT LBS Sa 
HU. KRATERY ETEA AN REIR RE AST e IRE i CT LYS oi o 
it, 但 是 , 这 个 增 量 在 实践 中 还 是 最 为 人 们 称道 的 . 

关于 希 尔 排序 还 有 几 个 其 他 结果 , 它们 需要 数论 和 组 合 数学 中 一 些 艰 深 的 定理 而 匡 主 要 
是 在 至 论 上 有 用 。 希 尔 排序 是 算法 非常 简单 旦 又 具有 极其 复杂 的 分 析 的 一 个 好 例子 : 

项 水 排序 的 性 能 在 实践 中 是 完全 可 以 接受 的 , 即使 是 对 于 数 以 万 计 的 N 仍 是 如 此 : 编 
程 的 简单 特点 使 得 它 成 为 对 适度 地 大 量 的 输入 数据 经 常 选用 的 算法 : 


7.5 HEHE 


如 第 6 Siae, PRACT] RAHA ESTE OCN log NET AS BERR. 基于 该 想法 的 算 
法 叫做 玲 排 序 {heapsorD 并 给 出 我 们 至 今 所 网 到 的 最 佳 的 大 O 运行 时 间 。 然 而 , 在 实践 中 它 
HEB FE FA Sedgewick 增 量 序列 的 希 涉 排序 ， 

回忆 在 第 6 章 建立 N 个 元 素 的 二 叉 堆 的 基本 上 方法， 此 时 的 花费 是 DCN) 时 间 。 然后 我 

们 执行 N 次 DeleteMin 操作 。 按 照 顺 序 ， 最 小 的 元 素 先 离开 该 堆 . 通过 将 这 些 元 素 记 录 到 第 
二 个 数组 然后 再 将 数组 找 员 间 来 ， N 个 元 素 的 排序 ,， 由 于 每 个 DeleteMin 化 费时 间 
O(log N), 因此 总 的 运行 时 间 赴 O(N log N). 

该 算法 的 主要 问题 在 于 它 使 用 P LABORIS BAL. 因此 ,存储 需求 增加 - : 倍 。 在 基 些 搓 
后 中 这 吉 能 是 个 问题 注意, 将 第 二 个 数组 拷贝 辐 第 一 T ER 85 Bah nf B RE ELE ON). 
这 不 可 能 显著 影响 运行 时 间 -。 这 个 问题 是 空间 的 问题 : 


BAER. DRA TN DEI BG E FI EY SSE TEAR DeleteMin <a, ALAR) 

I. 内 此 , (7 Fo PRS BY one) WOOK CF eC CE a. BRR TIA TH, 
它 售 有 六 个 元 素 第 一 次 DeleteMin 产生 个 A, HREBOE B a Phoc E. 因此 我 们 可 以 把 
A, REPL 6 上- FI DeleteMin nH: T A». H FERHERBUTE HB VQ Pho, AER HE 
As. etu 5 b 

使 用 这 种 策略 ,在 最 后 一 次 DeleteMin fi, PARUALRE LA GB WERT GL bR 如 未 
我 们 相机 这些 元 素 排 成 更 典型 的 递增 顺序 ， 财 么 我 们 训 以 改变 序 的 特 任 使 得 父亲 的 关键 宁 的 “328 
但 大 十 儿子 的 关键 字 的 值 ” 这 样 城 得 到 {max) 截 

A A UER E ERII ADT EIMA HSA 
Th. 得 一 件 事 者 是 在 数组 中 完成 的 . RAP REHE E Tb. AE N rr 
RR FEI. ORY ET Fa II N 1 Date “GH. 
Shit, BELA RRR Wy fo Ske ae. 例如 , SUA FPR 31, 41, 59. 26. 53 
SR. 97. 所 得 到 的 堆 如 图 7-6 也 小: 





图 7.6 丰 BuildHeap 阶段 以 二 的 (Ar ) BE 


I 7.7 显示 在 第 一 次 DeleteMax 之 后 的 堆 ， 从 图 小 看 出 , HF milo wow 31; HERA 
rh pg ST 的 那 一 部 分 从 技术 上 说 已 不 再 属于 该 堆 . 在 此 后 的 5 次 DeleteMax 操作 之 后 , AHE 
实际 上 只 在 一 个 元 素 , AERA PRC RSA AS IS AT 
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图 7-7 在 第 一 次 DeleieMax IG HE - -一 


执行 卉 排序 的 代码 在 图 7-8 中 给 出 : 稍微 复杂 的 征 ， Me CX HE, CEU E EUH F 


“ha 


um 


标 1 处 开始 , 而 此 处 堆 排 序 的 数组 包 洛 舍 置 4 处 的 数据 :. 因此 , EP Te aS 
有 些 不 同 , 不 过 变化 很 小 ， 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
define Lefrthild( id (2 7312 91» 
void 
PercDownt Elementlype AL J, int i, nt H 5 
1 


Tnt Child; 
ElementType Tmp; 


/8 lt fort Tmp = AL i J; Leftthiid( 1 J = N; = Child 3 
: 
f* orf Child = LeftChiTd( i); 
A 37/ if€ Child t= N - 1 & AL Child +27 > Al Child j 3 
f* 44/ Chi ld++; 
IF By Al i ] = AL Child J: 
fr FAF break 
i 
f* Be AL i 5 = Tmp 
} 
void 


Heapsort( ElementType AT ], int N ) 


| 
je Shy ifC Tmp < Af Child ] ) | 


int i; 
/* Uf for( 4 - N f 2; d == 0; i-- 5 /* BuildHeap */ 
EP LE PercrDown( A, i, No: 
A ge/ fort i = N - 1; i+ 0; i-- } 

{ 
ft 45/ Swap( &A[ O J, SAL i ] 3; /* DeleteMax */ 
fe 5*7 PercDown( A, 0, i 3; 


| } 
| 


图 7-8 MEHET 





7.5.1 堆 排 序 的 分 析 

我 们 在 第 6 章 看 到 ， 第 一 阶段 构建 堆 最 多 用 到 2N 次 比较 。 在 第 二 阶段 , 第 i 次 
DeleteMax 最 多 用 到 2Llogi 次 比较 ,总 数 最 多 为 2N log N 一 O (NYKER GZ N22). A 
jk. 在 最 坏 的 情形 下 , HERE RAIN log N- O(N) 次 比较 。 练习 7.12tb}) 让 你 证 明 对 
于 所 有 的 DeleteMax 操作 ,有 可 能 同时 达到 它们 的 最 十 情形 ， 

经 验 指出 , 堆 排序 是 一 个 非常 稳定 的 算法 : EOP REIL AA FE Ebr f SRB d RS M 
少 。 然 而 直到 最 近 ， 还 没有 人 能 够 指出 堆 排序 平均 运行 时 间 的 非 平凡 朋 ， 似乎 问题 在 于 连续 
的 DeleteMax 操作 破坏 了 玲 的 随机 性 ， 使 得 松 率 论证 非常 复杂 ;最近 ， 另 一 种 处 理 方 法 被 让 


ERO. 

定理 7.5 

xh ON SL FESTUS RL PL HES ETT HEHE ME. 所 用 的 比较 平均 次 数 为 2N log N- OCN log 
log N). 

ur RA: 


Fg E MERO Em PELE ONARE. 四 此 我 们 只 需要 让 明 第 一 阶段 的 界 。 设 一 个 排列 
Bll, 2, ..., Nie 


JE X = 


DES 7 TX DelewMax HARIA M FHES d, Lio HEAD TERE T 24 lee. WTSIA 


jg; A BRTH. FPE —- FTE SIL eost sequence LD: dja ei 了 第 二 


阶 自 的 开销 该 开销 由 Mp = N d, 给 出 ; 关 此 所 使 用 的 比较 次 数 是 2M, 
全 PON AN Dip TX OPP CRAP 7.322. FOND > (Nage, T e = 
2.74828. .. FRR WEA SLA EHE ER Ee E fe eb ad CPP a et NAG 的 开销 小 于 
i - Milog N - log log N — 4), SHEHIRI HH., Mp BS TFEHB db EM Wk 3: 
SOA CGORT- TW, 这 样 ， 比 较 的 平均 次 要 至 少 是 2M 因此, 我们 的 基本 目标 网 是 证 明 存 
asi SBOE EB RY aE 
"RD Zl de E425 452. 所 以 机 于 任意 的 二. 存在 根 元 来 可 能 到 法 的 27 al Be 


TELA ， 对 任意 的 序列 站 .对 应 DeleieMax P] à Ae RF PU TRES E a 
Say = 2" 04s . BUE 
fi n CR DFE HL. a- eG EAE: 
5,728. 


[E Arf d d, OTR 1 A og N_ 之 间 的 任 一 和 什 ,所 出 最 多 存在 (og N)^ 个 可能 的 序列 说. 
resp Bl. 5S ERE SE UT M OU $8 DeleteMax FRAUD Me OT OA MD IP 
rely ay T Be HEL Sr DX FE HEB DeleteMax 订 列 的 个 数 EX ME A v AT 388 Tr Cog 
N )* 2M 

AUP ae M ELS ee A 

M-g 
Nog NOX < Gog NY2" 
,一 上 

类 于 我 们 选择 M= N (og N 一 loglog N - 4). ASA HRS) FM 的 境 欧 个 数 最 多 
KON ALO)’. S. dE IBIWTERPEME, 定理 得 证 . 

M RIS E Ap. 可 以 证 明 , HERBERT EERIE N log N 一 OCNDIXIERZ, i ff 
fim ARTE BEP A Rx T S. MANI E HAE IN log N- O(N) Wk owe \“ 是 定 
由 7 了 .5s 中 下 线性 化 的 第 二 项 ); xxdé fHSESEUERE (GE SS Reg aR aE T ACRES IRI 


7.6 归并 排序 
现在 我 们 把 注意 力 转 到 上 归 并 排序 (mergewort】 JARRE OCN log NO we SEE:TIIM 
melt. Ii BE ERI EBS ET Ye te LTE tz Hoi TTL - TAR ETS D 
4 erp dte pute iE ie SE PS UIE RAY e. PIX PN 个 表 是 已 排序 的 . 所 以 在 将 答 
dt — :个 表 中 叶山 该 算法 可 以 通过 对 输入 数据 一 趟 排序 来 完成 ” 基 相 的 合并 算法 是 权时 
个 输入 数组 A ROB. 一 个 输出 数组 C, A 一 个 计数 器 Apir. Borr., Cpr. CAE IRSE rx 


奥数 组 的 开始 总 A Apir Al B[ Bprr | 中 的 较 小 者 被 找 疮 加 中 的 下 一 个 位 置 ， 相关 的 计 
效 器 向 前 推进 一 步 “ 当 两 个 输入 才 有 一 个 用 完 的 时 个. 则 将 另 -个 表 中 剩余 部 分 拷贝 到 


BRE LA OIF WP A R. 
[TT Tt 


REED ps] [rie wj | | 


Apir Bpir (ptr 


APEX A BUS 1.13. 24, 26, 数组 B3 42, 15, 27, 38. MARK RIAU I P: B 
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先 , 比较 在 1 和 2 之 间 进 行 . 1 被 加 到 人 中, 然后 13 $02 进行 比较 。 


Aptr Bpte Cptr 


2 被 添加 到 CC 中, 然后 13 15 进行 比较 。 


CEES) GSE) GREET 
i T 


Aptr Bptr Cprr 


230 13 被 添加 到 Co, 接 下 来 比较 24 和 15, 这 样 一 自 进行 到 26 R8 27 进行 比较 。 


GEE GE) DEEE 
ce) GREET 


Aptr Bptr Cpir 
n [spas Gr TI. 
Aptr Bpir Cptr 
Aptr Bptr Cptr 


将 26 Ws bs C rp, 数组 A 已 经 用 完 。 


elses) Geer 
T 1 


Aptr Bptr Cptr 
将 数组 BARES VLSU C 中 。 


| | 7|38| s12a 26 | 271 38 
|j [24|26] |2 15 | 27| 38 13 | 15124 |26 | | 


Apr Bptr Cpt 


合并 两 个 已 排序 的 表 的 时 间 显 然 十 线性 的 ， 因 为 最 多 进行 了 N 一 1 次 比较 , 其 中 N XUL 
素 的 总 数 。 为 了 看 清 这 一 点 . 注意 每 次 比较 都 是 把 -个 元 素 加 到 C 中 , 但 最 后 的 比较 除外 ， 
它 至 少 添加 两 个 元 素 。 

mb. 归并 排序 算法 很 容易 描述 。 如 果 N = 1. 那么 只 有 一 个 元 素 需 要 排序 , 答案 是 显 
然 的 。 否 则 , 违 归 地 将 前 半 部 分 数据 利 后 半 部 分 数据 各 自 归并 排序 ， 得 到 排序 后 的 两 部 分 数 
据 , 然后 使 用 上 面 描述 的 合并 算法 再 将 这 两 部 分 合并 到 一 起 例如 . oe Ao BAA 24, 
13, 26, 1, 2, 27, 38, 15 排序 , FRAT BB OS He f PT RH A V PE REEF , 得 到 上， 
13, 24. 26, 2. 15, 27, 38， 然 后 , 将 这 两 部 分 合并 、 最 后 得 到 1, 2, 13, £5, 24. 26, 27. 
38. 该 算法 是 经 典 的 分 治 (divide-and-conquer) 策 上 略 ， 性 将 问题 分 成 一 些小 的 问题 然后 递归 求 
SL. 而 治 的 阶段 则 将 分 的 阶段 解 得 的 和 个 答案 修补 到 一 起 。 ^rió Bop UAE E 7189 HE. 我 
Tt E URSI. | 

归并 排序 的 一 种 实现 方法 在 图 7.9 Pee th. ix T- ER Àj Mergesort 的 过 程 让 是 递归 例 程 
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MSort 的 一 个 驱动 程序 : 


void l 
MSort( ElementType A[ ], ElementType TmpArrayr ], 
int Left, int Right ) | 
Ld 


| int Center: 
iff Left < Rignt ) 
i 
Center = € Left + Right ) / 2: 
MSort( 4, Tmpárray, Left, Center 5; | 
MSart( A, TmpArray, Center + 1, Right ); | 
Merge A, TmpArray, Left, Center + 1, Right 3; 
t 
} 


void 
Mergesort( ElementType AL ], tnt N } 


i 
ElementType *TmpArray; 


TmpArray = malloc M * sizeof ElementType 5 3; 
ifi TmpArray != NULL } 


{ 
| MSort( A, TmpArray, D, N - 1 2; 
| free( TmpArray ); 

} 


else 
FatalError( "No space for tmp array!!!" J; 


图 7-9 归并 排序 例 程 


一 一- 


Merge 例 程 是 精妙 的 ， 如 采 对 Merge 的 每 个 递归 调用 均 局 部 声明 一 个 临时 数组 , 那么 在 
任 一 时 刻 就 可 能 有 log N 个 临时 数组 处 在 活动 期 , 这 对 于 小 内 存 的 机 器 则 是 致命 的 ， 邦 一 方 
fit. 如果 Merge 例 程 动态 分 孔 并 释放 最 小 量 临时 内 存 , ABA malloc 占用 的 时 间 会 很 多 P 
密 测 试 指出 , 由 于 Merge 位 于 MSor 的 最 后 一 行 , AU EE A Re EF he A iA 
动 ,而 旦 可 以 使 用 该 临时 数组 的 任意 部 分 ; 我 们 将 使 用 与 输入 数组 A 相间 的 部 分 , ae IA 
本 节 林 昆 描述 的 改进 。 图 7-10 实现 了 这 个 Merge 例 程 。 


7.6.1 归并 排序 的 分 析 
IHF EMSAM RAEN AACA, 我 们 必须 给 运行 时 间 写 出 一 个 递归 关 

A. 假设 N B20. 从 而 我 们 总 可 以 将 它 分 裂 成 均 为 偶数 的 两 部 分 .对 于 N = 1, 归并 
排序 所 用 时 间 是 常数 , 我 们 将 记 为 1。 否 则 , 对 N 个 数 归 并 排序 的 用 时 等 于 完成 两 个 大 小 为 
N/2 的 递归 排序 所 用 的 时 间 再 加 上 合并 的 时 间 , 它 是 线性 的 .下 述 方 程 给 出 准确 的 表示 : 

TU) = 1 

T(N)  2T(N/2) +N 
这 是 一 个 标准 的 递归 关系 , 它 可 以 用 多 种 方法 求解 。 我 们 将 介绍 两 种 方法 。 第 -种 方法 是 用 
N 去 除 递 归 关 系 的 两 地， 你 很 快 就 会 发 现 这 人 么 做 的 理由 。 相 除 后 得 到 

TON) | T(N/ 22 , 1 

N N/2 

该 方程 对 2 的 每 的 任意 的 N 是 成 立 的 , 我 们 还 可 以 写成 

T(N/2). T(N/4) | | 


N/2 N/4 








| /* Lpos = start of left half, Rnos = start of right half */ 
| void 
, Merge( ElementType AL J, ElementType TmpArray[ ], 
| int Lpos, int Rpos, int RightEnd 7} 
i 
| mit i, LeftEnd, kunbElements, TmpPos: 
LeftEnd = Rpos - 1; 


TmpPes = Lpos; 
HumElements = RightEnd - Loos + 1; 


| 
| 
| 
white¢ Lpos «= LeftEnd && Rpas <= RightEnd } | 
ifC AL Lpos ] <= AL Rpos ] ) | 
TmpArray[ TmpPos++ ] = Af Lpost++ ]; | 
else | 
TmpArray | TmpPos++ ] = Ai Rpos++ J; 
| 
while( Lpos <= LeftEnd ) /* Copy rest of first half */ | 
Tmpårray[ TmpPas++ ] = AL Lpos++ 7; 
while( Rpos <= RightEnd ) /* Copy rest of second half */ | 
TmpArray( TmpPos++ ] = AL Rpos++ 2; | 
/* Copy TmpArray back 7/ 
far( i = Di i < NumElements; i++, Right£nd-- ) 


/* main loop */ 
i A[ RightEnd ] = TmpArray[ RightEnd ]; 


JA 7-10 Merge DLE 


TINA) — TUNA) 十 1 


一 一 


N/4 NA 


TD TO), , 


2 l 
将 所 有 这 些 方 程 相 加 ,就 是 说 , HGS A BS A I RRS E E A R 
和 项 LNA2)ACN/2) 出 现在 等 号 两 过 可 以 消去 。 事实 上 , 实际 出 现在 两 边 的 项 均 被 消 
二 ,我 们 称 之 为 看 缩 (telescoping) 求 和 在 所 有 的 加 法 完成 之 后 , 最 后 的 结 轨 为 


TIN) FO) oy 
N — i + log 1 


RD BRAT Ec too oa e T V JH ERO AUS log N 个 , 故而 将 各 方程 末尾 的 1 相册 起 
来 得 到 log N。 再 将 两 边 同 乘 以 N ,我 们 得 到 最 后 的 答案 
TON) = Nlog N + N= O(N log NJ 

px». LAUER C DEOR AEE AS EA GR ED N, 那么 两 边 的 和 也 就 不 可 能 丢 锯 。 这 就 是 为 
什么 我 们 要 通 除 以 N 的 缘故 。 

另 一 种 方法 是 在 i 边 连 续 地 代 人 递归 关系 。 我 们 得 到 

TON) = 2T(N/) + N 
既然 我 们 可 以 将 N Z2 代入 到 上 面 的 方程 中 
2TONZ2) = 20QUTUNVA)) + NAZ) = ATONZA) 1 N 

因此 得 到 
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TON) = 47CN/4) + 2N 
贞 将 代入 到 上 面 的 等 式 中 去 , 我 们 看 到 
AT(N/4) = A(QTUNZS)) + NA) = RT(N/8S) AON 
因此 我 们 有 
TON) = STON/8) + 3N 
将 这 种 方式 继续 下 去 ,得 到 
TON) = 2*TUN 725). RN 
利用 上 = log N, iE 
TON) = NTD + Nlog N= Nlog N 1 N 

PEPE fi: FH EE URS IR] RR. PPA TREE. 把 它 与 到 一 张 标 准 的 
8 L X11 的 纸 上 可 能 更 好 , 这 样 会 少 出 些 数 学 错误 , TAR HES ENAR. BLAAIE 
更 偏重 于 使 用 蛮 力 进行 计算 . 

回忆 我 们 已 经 假设 N = 2 分析 可 以 更 如 精细 以 处 理 N 不 是 2 的 竺 的 情形 ,事实 上 ， 
答案 几乎 是 一 样 的 (通常 出 现 的 就 是 这 样 的 情形 ). 

虽然 归并 排序 的 运行 时 间 是 O(N log ND. 但 是 它 很 难 用 于 主 存 排序 . 主 改 问题 在 于 从 
并 两 个 排序 的 表 需 要 线性 附加 内 存 , 在 整个 算法 中 还 鉴 花费 将 数据 拷贝 到 临时 数组 再 拷贝 回 | 
来 这 样 - 些 附 加 的 工作 . 其 结果 严重 放 慢 了 排序 的 速度 ， 这 种 拷贝 可 以 通过 在 递归 变 符 层次 
时 审慎 地 转换 A 和 TmpArray 的 角 双 得 利加 和 免 。 归 并 排序 的 一 种 变形 也 村 以 非 递 归 地 实现 
(WW) 7.14), 但 即使 这 样 , 对 于 重要 的 内 部 排序 应 用 而 言 ， 人 们 还 是 选择 快速 排序 , 我 们 
将 在 下 - 节 描 述 这 种 算法 。 不 过 ,本章 稍 后 就 会 看 人 到， 合并 的 例 程 必 大 多 数 外 部 排序 算法 的 
基石 : 
7.7 快速 排序 

正如 它 的 名 字 所 标示 的 , 快速 排序 (quicksort) 是 在 实 践 中 量 快 的 已 知 排序 算法 , 它 的 平 
均 运 行 时 间 是 O(N log N), 该 算法 之 所 以 特别 快 ， 主 此 是 由 于 非常 精炼 和 高 度 优化 的 内 部 
循环 。 它 的 最 坏 情 形 的 性 能 为 OCN?), 但 稍 加 公 力 就 可 避免 这 种 情形 。 虽 然 多 年 来 快速 排 
序 算法 被 认为 是 理论 上 高 度 优 化 而 在 实 距 中 却 不 可 能 正确 编程 的 一 种 算法 , 但 是 如 今 该 算法 
简单 易 懂 而 且 不 难 证 明 。 像 归并 排序 一 样 , 快速 排序 也 是 - -种 分 治 的 递归 算法 : 将 数组 5 排 
序 的 基本 算法 由 下 列 简单 的 四 步 组 成 ; 

1. 如 果 5 中 元 素 个 数 是 0 或 1, 则 返回 : 

2. RS PHT v, ZARA piwot). 

3. WR S — {vis 中 其 余 元 素 ) 分 成 两 个 不 相交 的 集合 : S17 reS 一 lvl, xcvi 
S.— ic€ S - {ul ! vzvic 

4. JR lI quicksort( S, ) i, 继 随 v. 继而 quicksort( 92) ; 

E tS AA ZU 76 SR BS AE FE, 55 3p 4r x) BO RR A EO, 因此 这 就 成 了 
一 个 设计 上 的 决策 。 一 部 分 好 的 实现 方法 是 将 这 种 情形 尽 可 能 有 效 地 处 理 。 直观 地 看 ,我们 
项 望 把 等 于 概 组 元 的 大 约 一 半 的 关键 字 分 到 Si 中 ,而 另外 的 一 半分 到 S P. RERNE E 
— ARATE a. 


[233] 


[234] 
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i E 7-11 ARERR HEHOS — PRE, xx RERUM CRB LRA 的 ,集合 中 其 余 
FUR A AS BASES 递归 地 将 较 小 的 数 的 集合 排序 得 到 0, 13, 26, 31, 43, 57 GEIH 
法 则 3) ， 较 大 的 数 的 集合 类 似 处 理 , 此 时 整个 集合 的 排序 很 痉 易 得 到 。 





对 小 者 的 快速 排序 对 大 者 的 局 速 排 序 
$ i 
IDE» 
^w - "4 


0 13 26 31 G 57 65 75 81 92 


图 7-1! 说 明快 速 排 序 各 步 的 例子 


应 该 清楚 该 算法 是 成 立 的 , 但 是 不 清楚 的 是 , 为 什么 它 比 归并 排序 快 。 如 问 归并 排序 屠 
E, 快速 排序 递归 地 解决 两 个 子 问题 并 需要 线性 的 附加 工作 (第 (3) 步 ), 不 过 , 与 归并 排序 不 
同 , 这 两 个 子 问题 并 不 保证 共有 相等 的 大 小 , 这 是 个 潜在 的 隐患。 快速 排序 更 快 的 原因 在 
xo 第 (3) 步 分 割 成 两 组 实际 上 是 在 适当 的 位 置 进 行 并 量 非 常 有 效 , 它 的 高 效 弥 宰 了 大 小 不 
等 的 递归 调用 的 缺憾 而 且 还 有 越 出 。 

次 今 为 下 ,对 该 算法 的 描述 尚 忽 少 许多 细节 , 我 们 现在 就 来 补充 这 些 细 定 。 实现 第 (2) 
步 和 第 (3) 步 有 许多 方法 ; 这 里 介绍 的 方法 是 大 量 分 析 和 经 验 研 究 的 结 采 ， 它 代表 实现 快速 
排序 的 非常 有 效 的 方法 ， 哪怕 即使 是 对 该 方法 最 微小 的 偏差 都 可 能 引起 意 想不到 的 不 民 
5E. 


7.7.1 选取 枢纽 元 

虽然 上 面 描述 的 算法 无 论 选 拌 哪个 元 素 作 为 枢纽 郊 都 能 完成 排序 工作 , 但 是 有 些 选 择 显 
PREIE- 

一 种 错误 的 方法 

通常 的 ,没有 经 过 充分 考虑 的 选择 是 将 第 一 个 元 素 用 作 枢 纽 元 。 如 果 输 入 起 随机 的 , 那 
么 这 是 可 以 接受 的 , 但 是 如 果 输 入 是 预 排序 的 或 是 反 序 的 , 那么 这 样 的 枢纽 无 就 产生 一 个 劣 
质 的 分 割 , 因为 所 有 的 元 素 不 是 部 被 划 A S. 就 是 都 被 划 人 Sa BREA, MOU! RE 
生存 所 有 的 递归 调用 中 。 实 际 上 上， 如 果 第 . -- 个 元 素 几 作 枢纽 元 而 月 输入 是 现 先 排序 的 , 那么 
快速 排序 花费 的 时 间 将 是 二 次 的 , 可 足 实 际 上 上 却 根本 没 干什么 事 , DY. SRT, 
预 排序 的 输入 (或 具有 -大 段 予 排序 数据 的 输入 ) 是 相当 常见 的 , 网 此, 使 用 第 一 个 元 素 作 为 
椒 纽 元 是 绝对 糟糕 的 主意 , 应 该 立即 放弃 这 种 想法 、 另 一 种 想法 是 选取 前 两 个 互 民 的 关键 字 
中 的 较 大 者 作为 枢纽 元 , 不 过 这 和 只 选取 第 一 个 元 素 作 为 枢纽 元 具有 相同 的 害处 。 不 要 使 用 
xx Pi Fh Ex FAR COS TR ER o 
一 种 安全 的 作法 

- -种 安全 的 方针 是 随机 选取 枢纽 元 。 一 般 来 说 这 种 策略 间 常 安全 ,除非 随机 数 生 成 认 有 
问题 ( 它 木 像 你 可 能 想像 的 那么 罕见 ), 因为 随机 的 枢纽 元 不 可 能 总 在 接连 不 断 地 产生 劣质 的 
Hg. 5 -方面 , 随机 数 的 生成 一 般 是 昂贵 的 , 根本 减少 不 了 算法 其 余部 分 的 平均 运行 
上 时间 . 

三 数 中 值 分 割 法 (Medqian-of-Three Partitioning) 

一 组 N 个 数 的 中 值 是 第 [ NZ] 个 最 大 的 数 。 枢纽 元 的 最 好 的 选择 是 数组 的 中 值 。 不 六 
b. IRE, 莫 明 显 减 慢 快 速 排序 的 速度 。 这 样 的 中 值 的 人 千 计 车 避 以 道 过 随机 选取 二 
个 元 泰 并 用 它们 的 中 值 作为 枢纽 元 而 得 色 。 事 实 上 , 随机 性 并 没有 多 大 的 帮助 ， 因 此 -… 般 的 
做 法 是 使 用 云端 、 右 庙 利 中心 位 置 上 的 三 个 元 素 的 中 值 作为 枢纽 无 。 例 如 ,和 输 人 为 8，1, 4， 
9.6,3,5, 2, 7, 0, 它 的 左边 元 素 是 8, 右边 元 素 是 人 0， 中 心 位 置 (| (Left + Righi)72 D EM) 
元 素 是 6。 于 是 枢纽 元 则 是 e = 6。 显 然 使 用 三 数 中 值 分 割 法 消除 了 预 排序 输入 的 坏 情形 
(在 这 种 情形 下 ,这 些 分 割 都 是 一 样 的 )， 并 且 减 少 了 快速 排序 大 约 596 的 运行 时 间 。 

7.7.2 分 割 策略 

有 了 几 种 分 割 策略 用 于 实践 ,但 此 处 描述 的 分 割 方 法 能 够 给 出 好 的 结果 。 我 们 将 会 看 到 ， 
它 很 容易 做 错 或 产生 低 效 ,不 过 使 用 一 种 已 知 的 方法 却 是 安全 的 。 该 法 的 第 一 步 是 通过 将 杠 
纪元 与 最 后 的 元 索 交 贺 使 得 枢纽 元 离开 变 被 分 吕 的 数据 段 。;i 从 第 一 个 元 素 开始 而 ; 从 倒数 
第 二 个 元 素 开 始 。 如 果 最 初 的 输 人 与 前 面 一 样 ， 那么 直面 的 图 表示 当前 的 状态 。 


t i 


我 们 暂时 假设 所 有 的 元 素 互 异 , 后 面 我 们 将 着 重 考虑 在 出 现 重复 元 素 时 应 该 怎么 办 - TE 
为 “种 限制 性 的 情形 , 如 果 所 有 的 元 素 都 相同 ,那么 我 们 的 算法 必须 做 相应 的 工作 。 可 是 厅 
怪 的 是 ,此 时 做 错 事 却 特别 地 容易 。 

在 分 割 阶段 要 做 的 就 是 把 所 有 小 元 素 移 到 数组 的 左边 而 把 所 有 大 元 素 移 到 数组 的 右边 ， 


180 gBz* 


当然 ,“ 小 ”和 “大 ”是 相对 于 枢纽 元 而 言 的 - 

当 i 在 ; CIN, 我 们 将 ; 右 移 , 移 过 那些 小 于 枢纽 元 的 元 素 , 并 将 A. 移 过 那些 
大 于 枢纽 元 的 元 索 。 当 Ay 停止 时 ,， 指 回 一 个 大 无 素 而 7 HIT). WR: 在 j 的 
左边 , 那么 将 这 两 个 元 素 互 换 ， 其 效果 是 把 一 个 大 元 束 移 向 右边 而 把 一 个 小 元 素 移 向 天边 ， 
在 上 面 的 例子 中 , i 不 移动 , Aa DR. 情况 如 下 图 。 


Lad 
一 





在 最 后 一 步 ， 当 枢纽 元 与 ; 所 指向 的 元 素 交 换 时 , 我们 知道 在 位 置 < i 898 — 7L 
都 必然 是 小 元 素 , 这 是 因为 或 者 位 置 P 包含 一 个 从 它 开始 移动 的 小 元 素 , MAP 上 上 原来 
的 大 元 素 在 交换 期 间 被 置换 了 。 类 似 的 论断 指出 , 在 位 置 P > i 上 的 元 素 必 然 都 是 大 元 率 。 

我 们 必须 考虑 的 一 个 重要 的 细节 是 如 何 处 理 那些 等 于 枢纽 区 的 关 串 子 。 问题 在 于 当 38 
到 一 个 等 于 枢纽 元 的 关键 字 时 ,是 否 应 该 停止 以 及 当 j 遇 到 一 个 等 于 枢纽 元 的 关键 学 时 是 全 
应 该 停止 。 直 观 地 看 ，i 和 j 应 该 做 相同 的 工作 ,因为 否则 分 割 将 出 现 馈 问 - ditis. 95 
如 ,如 果 i 停止 而 j RS. 那么 所 有 等 于 枢纽 元 的 关键 字 都 将 被 分 到 S. Po 

为 了 搞 清 怎 么 办 更 好 , 我 们 考虑 数组 中 所 有 的 关键 字 都 相等 的 情况 ， 如 果 i 和; 部 停止 ， 
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那么 在 相等 的 元 素 间 将 有 很 多 次 交换 。 虽 然 这 似乎 没有 什么 意义 , 但 是 其 正面 的 效果 则 是 i 
$0; Here RI. 国 此 当 枢 纽 元 被 蔡 代 时 , 这 种 分 荐 建立 了 两 个 几乎 相等 的 子 数 组 。 归 并 
排序 分 析 告 诉 我 们 , 此 时 总 的 运行 时 间 为 O(N log N)。 

insti 和 j 都 不 停止 , 那么 就 应 沪 有 相应 的 程序 防止 POR; 越 出 数组 的 界限 ,不 进行 交换 
的 操作 。， 虽 然 这 样 似 乎 木鱼 , 但 是 正确 的 实现 方法 却 是 把 枢纽 元 交换 到 i 最 后 到 过 的 你 置 ， 
这 个 位 置 是 倒数 第 二 个 位 置 { 或 最 后 的 位 置 , 这 依赖 于 精确 的 实现 方法 )}、 这 样 的 做 法 将 会 产 
生 两 个 非常 不 殉 衡 的 子 数 组 。 如 果 所 有 的 关键 字 部 是 相同 的 , 那么 运行 时 间 则 足 OCN?), 
StF miS A dig. 其 效果 与 使 用 第 一 个 元 素 作为 枢纽 元 相同 。 它 花费 的 时 间 是 二 次 的 
可 是 却 什 么 事 也 没 干 ! 

这 样 我 们 就 发 现 ， 进行 不 必要 的 交换 建立 卫 个 均衡 的 子 数 组 要 比 蛮 王 冒险 得 到 两 个 不 均 
衡 的 子 数组 好 。 因 此 ,如 果 7 和; 遇 到 等 于 椒 纽 元 的 关键 字 , 那么 我 们 就 让 i Aly AMIE. XI 
于 这 种 输入 , 这 实际 上 是 不 花费 二 次 时 疝 的 四 种 可 能 性 中 惟一 的 一 种 可 能 。 

初 看 起 米 , sp ERE ELA ox SACER IEDPUOR HERES S MBS AE 5 008 个 相同 
的 元 素 排序 吗 ? 为 什么 ? 我 们 记得 , 快速 排序 是 递归 的 . WES 100 000 个 元 素 , 其 中 有 5 000 
个 是 相同 的 。 最 后 , 快速 排序 将 对 这 5 000 个 元 素 进 行 递归 调用 。 此 时 , 真正 重要 的 在 于 确 
保 这 5 000 个 相同 的 元 素 能 够 被 有 效 地 排 到 。 

7.7.3 小 数组 

对 于 很 小 的 数组 (NE 20), 快速 排序 不 如 栖 人 排序 好 。 不 仅 如 此 , 因为 快速 排序 是 递归 
的 .所 以 这 样 的 情形 还 经 常 发 生 。 通 常 的 解决 方法 是 对 于 小 的 数组 不 递归 地 使 用 快速 排序 、 
而 代 之 以 诸如 播 人 排序 这 样 的 对 小 数组 有 效 的 排序 算法 。 使 用 这 种 策略 实际 上 可 以 节省 大 约 
Is 此 (相对 于 自始至终 使 用 快速 排序 时 ) 的 运行 时 间 。 一 种 好 的 截止 范围 (cutoff range) Zé N 
= 10, 里 然 在 5 到 20 之 癌 任 -截止 范围 都 有 可 能 产生 类 似 的 结果 。 这 种 做 法 也 避免 了 一 此 
有 害 的 特殊 情形 , 如 取 三 个 元 素 的 中 值 而 实际 上 却 只 有 -~- 个 或 两 个 元 素 的 情 沉 。 

7.7.4 实际 的 快速 排序 例 程 

快速 排序 的 驱动 程序 见 图 7-12. 


void 
Quicksort( ElementType At J, int N ) 
i 





图 7-12 快速 排序 的 驱动 程序 


这 种 例 程 的 一 般 形式 将 是 传递 数组 以 及 被 排序 数组 的 范围 Left (Am) RI Right Ces). 
点 外 理 的 第 一 个 例 程 是 枢纽 元 的 选取 。 选 下 枢纽 元 晤 容易 的 方法 是 对 Al Left |. A Right]. 
AT Center | 适当 地 排序 。 这 种 方法 还 有 额外 的 好 处 , 即 该 三 元 素 中 的 最 小 者 被 分 在 A LLeft |. 
而 这 正 是 分 割 阶 段 应 该 将 它 放 到 的 位 置 。 三 元 素 中 的 最 大 者 被 分 在 AL Right |, 这 也 是 正确 
MOLE. 因为 它 大 于 枢纽 元 。 因 此 , 我 们 可 以 把 伐 纽 元 放 到 AT Right. 一 11 并 在 分 割 阶段 将 ; 
和 ; 初始 化 到 Left + 1 和 Right - 2, 因为 Al Left loh, 所 以 将 它 用 作 ; 的 警戒 标 
记 , 这 是 另 一 个 好 处 。 因 此 , 我 们 不 必 担 心 ; HR. i 将 停 在 那些 等 于 枢纽 元 的 关键 宇 
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ah, 故 将 枢纽 元 存储 在 A Right ~ 11, 将 提供 - :个 警戒 标记 。 图 7-13 中 的 程序 进行 二 数 中 
(AE. 它 具 有 所 撒 述 的 所 有 附加 的 作用 : 似乎 使 用 实际 上 不 对 Al Left]; A[ Right], A 
[Center] 排 序 的 方法 计算 根 纽 工 只 不 过 效率 稍微 降低 一 些 , 但 是 很 奇怪 , 这 将 产生 趟 结果 ( 见 















/* Return median of Left, Center, and Right */ 
/* Order these and hide the pivot */ 


ElementType 
Mediani( ElementType A[ ]. int Left, int Right 3 


+ 


int Center = ( Left + Right ) / 2; 


| ift AL Left ] > AL Center ] ) 
Swap( &&[ Left ], &AI Center ] »; 
ifi AL Left 3 > AE Right j } 
Swap( &A[ Left ], &A[ Right ! 3; 
: ift AL Center J > AL Right ] 2 
Swap( &A[ Center ], &&[ Right ] 3: 


/* Invariant: A[ Left ] <= Af Center ] <= AL Right ] */ 


Swap( @Af Center J, &A[ Right - 11 2; /* Hide pivot */ 
/* Return pivot */ 


return AL Right - 1 ]; 
} 


图 7-13 实现 二 数 中 值 分割 方法 的 程序 






#define Cutoff ( 3) 















void 
Qsort( ElementType A[ J, int Left, int Right 2 
Í 

int i, d: 

ElementType Pivot; 


/* if if{ Left + Cutoff <= Right > 
{ 
J+ 2*/ Pivot = Median3( A, Left, Right 3; 
/* Sr i = Left; j = Right - 1; 
ft arf for( ; i} 
{ 
f= 5*/ while( AT ++i ] < Pivot J: 
* uf whilet A[ --j ] > Pivot M } 
fe Fey iff i<j) 
A 8*/ Swap( SAL i 1, &AL j ] 5; 
else 
/* 9*/ break; 


} 
/*lo*/ Swapt &A[ 3 ], &A[ Right - 1 ] J; /* Restore pivot */ 









f/*1l*/ Qsort( A, Left, 一 1X; 
i Qsart( A, i + 1, Right }; 
} 
else /* Do an insertion sort on the subarray */ 


/*13*/ InsertionSort( A + Left, Right - Left + 1 7; 





图 7-14 快速 排序 的 主 例 程 


图 7-14 的 程序 是 快速 排序 真 目的 核心 。 它 包括 分 割 和 递归 调用 。 这 里 有 几 件 事 值得 注 
意 . 第 3 行将 ; 和 ; 初始 化 为 比 它们 的 止 确 值 超 出 1, 使 得 不 存在 需 紧 考 虑 的 特殊 情况 此 
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处 的 初 她 化 依赖 于 三 数 中 值 分 割 法 有 一些 附加 作用 的 事实 ; 如 果 按 照 简 单 的 枢纽 元 策略 使 用 
该 程序 而 不 进行 修正 , 那么 这 个 程序 是 不 能 让 确 运 行 的 , 原因 在 于 7 Aj PART RN 
而 不 再 存在 j 的 警戒 标志 。 

第 8 $189 Swap 为 了 速度 上 的 考虑 有 时 显 式 写 出 。 为 使 算法 速度 快 , 需 费 迫使 编 详 器 以 
E Hei A S AER X EE I. Aine 2, 许多 编译 器 都 将 自动 这 么 做 , 但 对 于 不 这 公司 的 
MIERE, 差别 可 能 很 明显 。 

An. 从 第 5 行 和 第 6 行 可 看 出 为 什么 快速 排序 这 人 么 快 : 算法 的 内 部 循环 由 -个 增 1/ 诚 
] 运算 ( 它 很 快 )、 一 个 测试 , 以 及 一 个 转移 组 成 。 该 算法 没有 像 在 轨 并 排序 中 邦 样 的 额外 技 
巧 ,不 过 ,这 个 程序 仍然 出 奇 好 复杂 。 邻 人 感 兴趣 的 是 将 第 3 行 到 第 9 行 用 图 7-15 中 列 册 的 
语句 代替 ,这 是 不 能 正确 运行 的 , BAB ALi] = ALj] = Pivot 则 会 产生 一 个 无 限 循 环 . 













/* 3*/ Ts Left + 1; j = Right - 7; 
/* ats for( i 1) 
i 


| /* ote while( A[ 1 ] < Pivot 5 i++; 
/* 6*7 while( AL j ) > Pivot ? j--: 
Q0 £5 T*/ if€i< j 2 
/* Bef Swap( &A[ i J, &A[ j 1 5: 
pisa 
| fe 9*7 


E 7-15 对 快速 排序 小 的 改动 , 它 将 中 断 该 算法 


7.7.5 快速 排序 的 分 析 

正如 归并 排序 那样 , 快速 排序 也 是 递归 的 , 因此 , 它 的 分 析 需 要 求解 一 个 递 推 公式 : 我 
们 将 对 快速 排序 进行 这 种 分 析 , 假设 有 一 个 随机 的 枢纽 元 (不 用 三 数 中 值 分 割 法 ), 对 一 些小 
的 文件 也 不 使 用 截止 范围 。 和 归并 排序 一 样 , 取 T(O) = TO) = 1, 快速 排序 的 运行 时 间 
等 于 两 个 递归 调用 的 运行 时 间 加 上 花费 在 分 割 上 的 线性 时 间 ( 枢 纽 元 的 选取 仅 花 费 常数 时 
间 )。 我 们 得 到 基本 的 快速 排序 关系 : 


TIN) = T(i) + TUN- i- 1) +N (7.1) 
Ep, i = 1S JES, 中 的 元 素 个 数 。 我们 将 考察 三 种 情况 。 
最 二 情况 的 分 析 
枢纽 元 始终 是 最 小 元 素 。 此 时 i = 0, 如 果 我 们 忽略 无 关 紧 要 的 0) = 1, 那么 递 推 关 系 为 
T(N})= T(N-1)+eN,N>1 (7.2) 
反复 使 用 方程 (7.2), 我 们 得 到 
T(N-1}= T(N—2}+c(N-1) (7.3) 
TON -2}= TUN-3) + c(N -2) (7.4) 
T(2)= Ti) + c(2) (7.5) 


将 所 有 这 些 方 程 相 加 , 得 到 
T(N) = TO) 1 c2, i = OWN) (7.6) 


这 正 是 我 们 前 面 宣布 的 结果 。 
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最 好 情况 的 分 析 
在 最 好 的 情况 下 , 枢纽 元 正好 位 于 中 间 - 为 了 简化 数学 推导 , 我 们 假设 两 个 子 数 组 恰好 
各 为 诛 数 组 的 一 半 大 小 , 虽然 这 会 给 出 稍微 过 高 的 合计 , 但 是 由 于 我 们 只 关心 大 上 O 〇 答案 , 因 
结果 还 是 可 以 接受 的 。 
TEN) 22TUNZ 2) * cN (7.7) 
ALN ERDE. T) SPA, 
T(N) T(N/2), 








N ^ N/2 TS (7.8) 
我 们 反复 套用 这 个 方程 , 得 到 
T(N/2 / 
Ns Nat (7-9) 
TNA) = TNS) + te (7.10) 
TOL IU, (7.10) 
将 其 47.73 到 (7.11) 的 方程 如 起 来 ,并 注意 到 它们 共有 log NT, FE 
TIN) - TCU + clogN (7.12) 
由 此 得 到 
TUN) = cNlogN + N= O( NlogN) (7.13) 
注意 ,这 和 归并 排序 的 分 析 完 全 相同 , 因此, 我 们 得 到 相同 的 管 案 。 
平均 情况 的 分 析 


这 是 最 难 的 部 分 。 对 于 平均 情况 , 我 们 假设 对 于 S 每 一 个 文件 大 小 都 是 等 可 能 的 , A 
此 每 个 大 小 均 有 概率 1AN。 这 个 假设 对 于 我 们 这 里 的 枢纽 元 选取 和 分 割 方法 实际 上 是 台 理 
的 , 不 过 , 对 于 某 些 其 他 情况 它 并 不 合理 。 那 些 不 保持 子 文件 (subfile) 随 机 性 的 分 割 方法 个 
能 使 用 这 种 分 析 方 法 . 有 趣 的 是 ， 这些 方法 看 来 导 至 程序 在 实际 运行 中 论 费 中 长 的 轩 站 。 

由 该 假设 可 知 ，T( 站 (从 而 TON — i — 1)) 的 平均 值 为 (17N) DO PU) 。 此 时 方程 
{7.1) 变 成 


rin) = 2033 TG) |+ oN (7.14) 
如 果 用 N 乘 以 方程 (7.14)， 则 有 B 
wr) = 2| S 70] cN? (7.15) 
我 们 需要 除去 求 和 符号 以 简化 计算 。 ERE. 我 们 可 以 再 套用 一 次 方程 (7.15), 得 到 
(N - DTN -D = [XT] e 1) (7.16) 
车 从 (7.15) 减 去 (7.16), 则 得 到 7 
NT(N) -E(N- D TUN - D 22TUN - 1) +2c0N - e (7.17) 


移 项 、 合 并 并 除去 右边 无 关 紧 要 的 项 -“ , 我 们 得 到 
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NTON)-GON* D T(N -1) * 2cN (7.18) 

HEA -ARATIN - Dm T(N REAA., HRALA, Aih e 
{7.18) 的 形式 不 适合 。 为 此 , 用 NtN +1) 除 方程 (7.18): 
TON) | TIN-D , 2c. 











N+1 N N«1 (7.19) 
MATUTE 
TUN -1) T(N-2 
TND- a bs (7.20) 
T(N-2). T(N- 
(N- ? = Ty tx (7.21) 
T2). T c 
TO) DD V2 (7.22) 
将 方程 (7.19) 到 (7.22) 相 加 , 得 到 
ATi 
TCN) _ TQ) + 2c > 4 (7.23) 


该 和 太 约 为 log,(N + 1) + at 其 中 ye. 577 WARE AY Euler's constant), TJ 


TUN) _ 
NI 





O(logN) (7.24) 


M. iii 
T(N} = OCNlogN) (7.25) 

虽然 这 里 的 分 析 看 似 复 杂 , 但 是 实际 上 并 不 复杂 一 一 一 旦 你 看 出 某 些 递 推 关系, 这 些 步 
又 中 很 自然 的 。 该 分 析 实 际 上 还 可 以 再 进一步 。 上 面 描述 的 高 度 优 化 的 形式 也 中 经 被 分 析 
过 , 结果 的 获得 非常 困难 , 涉及 到 一 些 复杂 的 递归 和 高 深 的 数学 ， 相 等 关键 字 的 影响 也 己 仔 
细 地 进行 了 分 析 , 实际 上 所 介绍 的 程序 就 是 这 么 做 的 。 

7.7.6 选择 的 线性 期 望 时 间 算 法 

可以 修改 快速 排序 以 解决 选择 问题 {selection problem), 这 种 问题 我 们 在 第 1 章 和 第 6 3 
FE 经 看 到 ， 当 时 ， 遂 过 使 用 优先 队列 , 我 们 能 够 以 时 间 O(N + k log N) 找 到 第 个 最 大 
(最 小 ;元 。 对 于 查找 中 值 的 特殊 情况 , 它 给 出 一 个 OCN log NRA. 

由 于 我 们 能 够 以 OCN log N) 时 间 给 数组 排序 , 因此 可 以 期 望 为 选择 问题 得 到 一 个 更 好 
的 时 间 界 。 我 们 介绍 的 查找 集合 S 中 第 有 个 最 小 元 的 算法 几乎 与 快速 排序 相同 。 事 实 上 ， 其 
前 三 步 是 一 样 的 。 我 们 将 把 这 种 算法 时 做 快速 选择 (quickselect)。 令 153i1 为 S, 中 元 素 的 个 
数 ， 快速 选 择 的 步骤 如 下 : 

1 .如果 |S| = 1, BAe = 1, 并 将 S 中 的 元 素 作为 答案 返回 。 如 此 使 用 小 数组 的 截止 
(cutoff) HEB] SICCUTOFF, 则 将 S 排序 并 返回 第 个 最 小 元 : 

2 ,选取 一 个 枢纽 元 vE S. 

3. 将 集合 S - iw! 分 割 成 S, 和 5;， 就 像 我 们 在 快速 排序 中 所 做 的 那样 

4. ip Rec S.l, 那么 第 不 个 最 小 元 必然 在 51 中 。 在 这 种 情况 下 ， 返回 quickselect 
(S,, EK), WHR = 1 + |S1|，, 那么 枢纽 元 就 是 第 上 个 最 小 到 ， 我 们 将 它 作 为 答案 返回 。 人 下 


! 


44 : 


bo 


BLA 





则 , 这 第 上 个 最 小 匹 就 在 S: P. EE S 中 的 第 一 151| — 了 1 个 最 小 匹 。 我 们 进行 - OE 
归 调 用 并 返回 quickselect (85, & — 18,, — 1). 

与 快速 排序 对 比 , RRR iNT -次 递归 调用 而 不 是 下 次 ， 快速 选 拌 的 最 坯 情况 利 快 
速 排序 的 相间 , 也 是 OCN). EDUUEGE. 这 是 因为 快速 排序 的 最 坏 情况 发 生 开 S, 和 S: 有 
一 个 是 空 的 时 候 ; Fb, 快速 选择 也 就 不 是 真 的 节省 -- 次 递归 调用 。 不 过 , 平均 运行 时 间 是 
O(N)。 具体 分 析 类 似 于 快速 排序 的 分 析 . 我 们 将 它 留 作 一 道 练习 题 ， 

快速 选择 的 实现 甚至 比 抽象 的 描述 还 去 简单 ,其 程序 见 图 7-16.， 当 算法 终止 时 , WS CT 
最 小 元 就 在 位 置 志 七， 这 破坏 了 原来 的 排序 ; 如 果 不 希 望 这 样 ,那么 需要 微 -一 份 搁 内. 






/* Places the kth smallest element in the kth position */ 
/* Because arrays start at 0, this will be index k-1 */ 
void 

Qselect( ElementType AL ], int k, int Left, int Right ) 
{ 

























int i, j; 
ElementType Pivot: 
ifi Left + Cutoff <> Right J 
Pivot = Mediani( A, Left, Right 3}; 
/* uFi i = Left; j = Right - H; 

fe 4*/ fort ; ; ) 


/* Sy while( A( ++i ] < Pivot 21 3 


} 
else /* Do an insertion sort on the subarray */ 
InsertionSaort( A + Left, Right - Left + I); 


| A Br whilef AL j ] > Pivet 51 } 
fe Fi iff i<j} 
| /* 8"/ Swapit BAL 1 J], &A[ j ] 3: 
else 
A g*/ break 
} ， 

| /*l0*/ Swap( GAL i ], GAL Right - 1 ] 5); /* Restore pivot */ 

/*11*/ TC k s= ) 

f*12"/ Qselect( A, k, Left, i - 1}; 

/*13"/ else iff k » 7+ 1? 

/*14*/ Qselect( A, k, 7 + 1, Right 5; 
l 


/*15*/ 





图 7.16 快速 选择 的 主 例 程 


合用 三 数 中 值 选 取 枢 纽 元 的 方法 使 得 最 坏 情况 发 牛 的 机 会 几乎 是 微不足道 的 。 然 而 , XE 
过 仔细 选择 松 纽 元 , 我 们 可 以 请 除 二 次 的 最 坏 情况 而 保证 算法 是 O(N) 的 .可 中 这 么 做 的 额 
外 开销 是 相当 大 的 , 因此 最 终 的 算法 主要 在 于 理论 上 的 意义 。 存 第 10 章 我 们 将 考查 选择 问 
题 的 线性 时 间 最 坏 情形 算法 , 我 们 还 将 大 到 选取 枢纽 元 的 一 个 有 趣 的 技巧 , CRER RIA 
在 实践 中 多 少 要 快 一 些 。 
7.8 大 型 结构 的 排序 

关于 排序 的 全 部 讨论 , 我 们 已 经 假设 要 被 排序 的 元 素 是 一 些 简单 的 整数 。 Ti s ELS 
某 个 美 键 字 对 大 型 结构 进行 排序 。 例 如 , RAT RAL RASC, 每 个 记录 由 姓 
和 名、 地址、 电话 号 码 、 诸 如 工资 这 样 的 财务 信息 、 以 及 税务 信息 组 成 。 我 们 可 能 想 要 通过 一 
个 特定 的 域 ， 比如 姓名 , 来 对 这 些 信 息 进 行 排序 。 对 于 所 有 的 算法 来 说 ， 基本 的 操作 就 是 父 
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所 ,不 过 这 里 交换 两 个 结构 可 能 是 非常 品 贵 的 操作 ， 因 为 结构 实际 上 很 大 ,在 这 种 情况 下 ， 
实际 的 解法 是 让 输入 数组 包含 指向 结构 的 指针 ， 我 们 通过 比较 指针 指向 的 关键 字 ， 并 在 必 娄 
时 交换 指针 来 进行 排序 、 这 意味 着 .所 有 的 数据 运动 基本 上 让 像 我 们 对 整数 排序 那样 进行 
我 们 称 之 为 间接 排序 (indireet soring); 可 以 使 用 这 种 方法 处 理 我 们 已 经 描述 过 的 大 部 分 数据 
LM] ”这 证 明 我 们 关于 复杂 数据 结 愧 处 理 时 不 必 大 眉 策 禾 效 率 的 假设 是 正确 的 。 


7.9 排序 的 一 般 下 异 


贡 然 我 们 得 到 一 些 OCN log NN) 的 排序 算法 . 但 是 , 疝 不 清楚 我 们 是 天 还 能 做 得 现 好 . 
本 节 我 们 证 明 , 任何 只 用 到 比较 的 算法 在 最 坏 情 沉 下 需要 QCN log NYRR OMT AON 
log NATH), 央 此 归并 排序 和 堆 排 序 在 --- 个 常数 央 子 范 赎 内 是 最 优 的 ， 访 证明 可 以 进 - - 
步 证 明 即 使 是 在 平均 情况 下 ， 只 用 到 比较 的 任意 排序 算法 都 逢 要 进行 QUON log ND) 次 比较 ， 
这 意味 着 . 快速 排序 在 相差 一 个 常数 因子 的 范 央 内 平均 是 最 优 的 

特别 地 ， 我 们 将 证 明 下 列 结果 : 只 用 到 比较 的 任何 排 厅 算法 在 最 乐 情况 下 郭 需要 
[log NT) 次 比较 并 平均 需要 log( NT 次 比较 。 我 们 将 假 衣 ,所 有 N 个 元 素 是 互 蜡 的 ,因为 
(E(u) AEF BE AR Se CER PE eT 
7.9.1 决策 树 

Xx RPH decision tree) 昆 用 于 证 明 下 界 的 抽象 概念 。 在 我 们 这 里 . 决策 树 足 一 : 棵 二 义 树 . 
每 个 节点 表示 在 元 素 之 出 一 组 可 能 的 排序 , 它 与 已 经 进行 的 比较 Xx. HERMES ERI 
的 边 . 

图 7.17 中 的 决策 树 表 示 将 二 个 元 素 a, b Fc 持 序 的 算法 。 算 法 的 初始 状态 在 恨 处 
(我 们 将 可 互 换 地 使 用 术语 状态 和 节点 .) 没 有 进行 比较 , 因此 所 有 的 顶 序 都 是 合法 的 。 这 个 
特定 的 算法 进行 的 第 一 次 比较 是 比较 a 入 。 两 种 比较 的 结 朵 导 禾 两 种 可 能 的 状态 .如 厅 
4 € b. 那 么 只 有 二 种 可 能 性 被 保留 .如果 算法 到 达 节 点 2, BAER ILE a 和 re， 其 他 算法 
可 能 会 做 不 同 的 工作 :; 不 同 的 算法 可 能 有 不 同 的 决策 树 ” 若 a > c. 则 算法 进入 状态 5. 由 
于 有 只 存在 一 种 顺序 , 因此 算法 可 以 终止 并 报告 它 已 经 完成 了 排序 . fra «c 划算 法 尚 不 能 
终止 ,因为 存在 两 种 可 能 的 顺序 , 它 还 不 能 肯定 哪 种 是 正确 的 。 在 这 种 迟 况 下 ， 算法 还 将 由 
Gta BER IAE. 

BR ot F(a FL REP HEFE BT 6$ — A RA Be. 4R, 只 有 输入 数据 非常 
少 的 情况 画 诀 策 树 才 是 可 行 的 。 由 排序 算法 所 使 用 的 比较 次 数 等 于 最 深 的 树叶 的 深度 。 在 我 
们 的 例子 中 , 该 算法 在 域 坏 的 情况 下 使 肝 了 二 次 比较 ; 所 使 用 的 比较 的 平均 次 数 等 于 衬 叶 的 
平均 深度 。 由 于 决策 树 很 大 , 因此 必然 存在 一 些 长 的 路 径 。 为 了 证 明 下 规 ， T SE UE AA Aut HE 
本 的 树 性 质 

引 理 7.1 

A TORR Ad MOMS. 则 全 最 多 有 2° TH. 

证 阴 : 

用 数 深 败 纳 法 证 明 。 如 果 = 0. 则 最 多 存在 -个 树叶 , 因此 基准 情况 为 真 : SW, T 
在 一 个 根 , 它 不 可 能 是 树 时 ， 其 左 子 山 和 右 子 树 中 每 一 个 的 深度 最 多 是 4 一 1 HB 
设 , 每 . 棵 子 树 最 多 有 27-! 个 树 时 ,因此 总 数 最 多 有 24 个 树 呈 ”这 就 让 明了 该 引 理 . 
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acbec beace 
acceb bec<a 
c«a«h e<b<g 
9 9 
a<c cea bec cab 
a<b<c 
z c 
b«c cep acc ea 
8) (9) Q9) QU 
图 7-17 三 元 素 排序 的 决策 树 
引 理 7.2 
BAL 片 树叶 的 二 叉 树 的 深度 至 少 是 | tog L |。 
UE AR : 
由 前 曾 的 引 理 立即 推出 。 
定理 7.6 
只 使 用 元 素 问 比较 的 任何 排序 算法 在 最 坏 情 况 下 至 少 需要 | log CN T) | 次 比较 。 
WE AR : 


对 N 个 元 素 排 序 的 决策 树 必 然 有 NT1 TRIES MSS BW EM EH. 
定理 7.7 

只 使 用 元 素 间 比较 的 任何 排序 算法 需要 进行 A(N log N) 次 比较 。 

证 阴 : 

由 前 面 的 定理 可 知 , 需要 log( N1) 次 比较 。 

log (NT) = log (N CN - D ON - 2) ...(2) (1)) 


= log N + log (N - 1) + log (N - 2) +... + log 2 + log 1 
J log N + log (N — 1) + log (N — 2) * ... + log NZ 
N, N 

= log 3 

N ony N 

"5 logN 2 


=Q N log N} 


一 一 -一 一 一 
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这 种 类 型 的 下 界 论断 ， 当 用 于 征明 最 二 情形 结 玉 时 ， 有 村 间 做 信息 -理论 (infonnation- 
theorertie) 下 界 。 一般 定理 说 的 是 , WREE P RR SEA, 而 问题 是 YES/NO 的 
形式 , 那么 通过 任何 算法 求解 该 问题 在 某 种 情形 下 总 需要 | log P | 个 问题 。 对 于 任何 基于 比 
较 的 排序 算法 的 半 均 运行 时 间 , 证 明 类 似 的 结果 是 可 能 的 。 这 个 结果 由 下 列 引 理 导 出 ,我 们 
将 它 留 作 练习 ; 具有 工 片 树叶 的 任意 二 叉 树 的 平均 深度 至 少 为 log Lo 


7.10 桶 式 排序 


虽然 我 们 在 上 一 节 证 明了 任何 只 使 用 比较 的 一 般 排序 算法 在 最 坏 情况 下 需要 运行 时 间 
N (N log N), 但 是 我 们 要 记 往 , 在 某 些 特殊 情况 下 以 线性 时 间 进 行 排序 仍然 是 可 能 的 ， 

一 个 简单 的 例子 是 桶 式 排序 (bucket sort). HERAF REGS iE LE, BAUR Ae 
额外 的 信息 。 输 入 数据 A], Ar. ..., An 必须 只 出 小 于 M 的 正 整数 组 成 。( 显 然 还 可 以 对 其 
进行 扩充 .) 如 果 是 这 种 情况 , 那么 算法 很 简单 ; 使 用 一 个 大 小 为 M BRA Count. 的 数组 , CR 
初始 化 为 全 0。 于 是 ，Count AM 个 单元 (或 称 桶 ), 这 些 桶 初始 化 为 空 。 当 读 A; AY, Count 
[A,] 增 1。 在 所 有 的 输入 数据 读 人 人 后, 扫描 数组 Count, TTR MARR RK. 该 算法 用 时 
OM + ND; 其 证 明 留 作 练 习 。 如 果 M AON), 那么 总 量 就 是 OWN). 

虽然 这 个 算法 似乎 干扰 了 下 界 , 但 事实 上 并 没有 ,因为 它 使 用 了 比 简单 比较 更 为 强 太 的 
操作 ”通过 使 适当 的 桶 增值 , 算法 在 单位 时 间 内 实质 上 执行 了 一 个 ML- 路 比较 - 这 类 似 于 用 
在 可 扩散 列 上 的 策略 ( 见 5.6 节 )。 显 然 这 不 属于 那 种 下 界 业 已 证 明 的 模型 。 

不 过 .该 算法 确实 提出 了 用 于 证 明 下 界 的 模型 的 合理 性 问题 。 这 个 模型 实际 上 是 一 个 强 
模型 ,内 为 通用 的 排序 算法 不 能 对 于 它 可 以 预见 到 的 输入 类 型 做 假设 ,但 必须 仅仅 基于 排 抒 
信息 做 一 些 决策 。 很 自然 地 ,如 果 存 存 额 外 的 可 用 信息 ， 了 我 们 应 该 有 望 找 到 于 为 有 效 的 算 
ik, PRU aS) A fae BIR BF So 

尽管 桶 式 排序 看 似 太平 凡 用 处 不 大 , 但 是 实际 上 却 存 在 许多 其 输入 只 是 一 些小 的 整数 的 
情况 , 使 用 像 快 速 排序 这 样 的 排序 方法 真 的 是 小 是 大 作 了。 


7.11 外 部 排序 


沦 今 为 止 ,我 们 考查 过 的 所 有 算法 都 需要 将 输入 数据 装 人 内 存 。 然 而, 存在 一 些 应 用 三 
E, 它们 的 输 人 数据 量 太 大 装 不 进 内 在。 本 节 将 讨论 一 些 外 部 排序 算法 (external sorting), "E 
们 是 设计 用 来 处 理 很 大 的 输入 的 。 

7.11.1 为 什么 需要 新 的 算法 

大 部 分 内 部 排序 算法 都 用 到 内 存 可 直接 寻 址 的 事实 。 希 尔 排序 用 一 个 时 间 单位 比较 元 系 
ATi) MAL: — 太 ]。 堆 排序 用 一 个 时 间 单位 比较 元 素 A[ 门 和 ALi*2 + 1]。 使 用 三 数 中 
估 分 划 法 的 快速 排序 以 常数 个 时 间 单位 比较 A Left), A! Center ] 各 AL Right]. RASA. 
数据 在 磁带 上 , 那么 所 有 这 些 操作 就 失去 了 它们 的 效率 , 因为 磁带 上 的 元 素 只 能 被 腺 序 访 
J 。 即 使 数据 在 一 张 磁盘 上 ,和 由 于 转动 磁盘 和 移动 位 头 所 党 的 延迟 ,仍然 存在 实 队 上 的 效率 
损失 。 

为 了 看 到 外 部 访问 究 况 有 多 慢 , 可 建立 一 个 大 的 随机 文件 , 但 不 能 太 大 以 致 装 不 进 日 
大 。 将 该 文件 读 入 并 用 一 种 有 效 的 算法 对 其 排序 。 将 该 输入 数据 进行 排序 所 花费 的 时 间 导 将 
其 志和 所 花费 的 时 间 相 比 必然 是 无 足 轻重 的 , 尽管 排序 是 O(N dog. NO BETTE AIC FUP 


过 化 费 OCNORTIB], 
7.11.2 外 部 排序 模型 

各 种 各 样 的 海量 存储 装 莘 使 得 外 部 排序 比 内 部 排序 对 设备 的 依赖 性 墅 严重 得 多 。 我 们 将 
冶 虑 的 一 些 算 法 在 磁带 上 工作 ,而 磁带 可 能 是 最 受 限 制 的 存 鱼 媒体 。 由 于 访问 伐 带 上 一 个 无 
dn EUR EDU TCR IRI Dr. 因此 磁带 必须 要 有 (了 两 个 方向 上 ) 连 续 的 顺序 才能 够 被 有 效 
地 访问 

我 们 将 假设 至 少 有 二 个 砌 届 驱 动 器 进行 排序 工作 . 我 们 需要 两 个 蝶 动 器 执行 有 效 的 排 
序 ， 而 第 三 个 驱动 器 进行 简化 的 工作 。 如 果 只 有 一 个 态 瑞 蝶 动 器 可 用 , 那么 我 们 则 不 得 不 
说 : 任何 算法 都 将 需要 OLN? NR ii. 
7.11.3 简单 算法 

基本 的 外 部 排序 算法 使 用 归并 排序 中 的 Merge IER. RRIA UHR E. Tu. Tu 
Ti ,Ti， 它 们 是 两 盘 和 输入 傍 带 和 两 盘 输 出 磁带 。 根 据 算法 的 特点 ， 磁 带 a 和 磁带 5 BAA 
作 输 入 磁带， 和 要么 用 作 输 出 磁带 。 设 数据 最 初 在 Ta 上 ,并 设 内 存 可 以 -次 容纳 (和 排序 ) M 
个 记录 ， 一 种 自然 的 做 法 是 第 一 步 从 输入 感 带 一 次 读 人 M 个 记录 , 在 内 部 将 这 些 记 录 排 序 ， 
然后 冉 把 这 些 排 过 序 的 记录 交替 肌 写 到 T, SE 有 上。 我 们 将 把 每 组 排 过 序 的 记录 叫做 -个 
顺 束 (run)。 懒 完 这 些 之 后 , 我 们 倒 回 所 有 的 磁带 。 设 我 们 的 输入 与 希 尔 排 序 的 例子 中 的 输 
人 数据 相同 . 
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现在 TA TofS AWB. Se pipe T REIS — T UR CROPS BOT. FEES 
REA T.b.XRR—T—RHKISNUBR. 然后 , 我 们 再 从 每 盘 磁 带 取 出 下 一 个 顺 串 , 全 
Jt. SHE RUNE] 人 ,上 。 继 续 这 个 过 程 , 交替 使 用 TaM To. 直到 Tym DA. HORT. 
或 者 Ty AM TAS, 或 者 剩 下 一 个 顺 串 。 对 于 后 者 , 我 们 把 剩 下 的 顺 捉 拷贝 到 适当 的 硕 串 
上 cp mE, 并 重复 相同 的 步骤 ,这 一 次 用 两 盘 a 磁带 作为 输入 , PUR o GE 
作为 输出 ,结果 得 到 -… 些 AM 的 顺 早 。 我 们 继续 这 个 过 程 直 到 得 到 长 为 N BI TUB 

xr SERERE log N/M) | 趟 工作 , 外 加 一 - 趟 构造 初始 的 顺 串 。 例 如 , 若 我 们 有 1 000 万 
个 记录 , 每 个 记录 128 MER, 并 有 4 兆 字 季 的 内 存 , 则 第 一 未 将 建立 320 SR, WTR 
们 再 需要 9 趟 以 完成 排序 。 我 们 的 例子 再 需要 flog13/31=3 趟 , 见 下 图 所 不 。 
7.11.4 多 路 合并 

如 果 我 们 有 额外 的 磁带 ， 那 么 我 们 可 以 减少 将 输 人 数据 排序 所 需 权 的 趟 数 ,， 通过 将 基本 
的 (2 路 ) 合 并 扩充 为 志 路 合并 就 能 做 到 这 一 点 、 





两 个 顺 申 的 合并 操作 通过 将 每 一 个 输入 磁带 转 到 每 个 顺 串 的 开头 来 完成 。 然 后 ,找到 较 
小 的 元 素 . 把 它 放 到 输出 磁带 上 ,并 将 相应 的 输入 磁带 向 前 推进 。 如 果 有 上 Ende A duas. ED 
么 这 种 关 法 以 相同 的 方式 工作 , MCKIE F, 它 发 现 POR PR CR EH 
有 此 复杂。 我 们 可 以 通过 使 用 优先 队列 找 出 这 些 元 素 中 的 最 小 元 。 为 了 得 出 下 一 个 写 到 磁 蕉 
上 的 元 素 , 我 们 进行 一 次 DeleteMin 操作 ， 将 相应 的 磁带 向 前 推进 , 如 果 在 输入 磁带 上 的 顺 
串 尚 未 完成 ,那么 我 们 将 新 元 素 揪 入 到 优先 队列 中 。 仍 然 利 几 前 面 的 例子 , 我们 将 输入 数据 
分 配色 AERE EF. 





Ly BER Ra WB zs. 使 用 天 路 合并 所 需要 的 趟 数 为 iogs(N7M) 1, ROS REGALE 
BEEE k ACD, MF RW. AAEN., 因为 Togs(1373)1= 2. 如果 我 们 有 10 Æ 
磁带 ,此 时 上 有 = 5， 而 前 一 节 的 大 例子 需要 的 趟 数 将 是 | logs320 1= 4. 
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7.11.5 多 相合 并 

二 一 节 讨 论 的 天 路 合并 方法 需 皮 使 用 28 BENE. 这 对 某 些 应 用 极为 不 伍 。 只 使 用 到 +1 
PRAT A OY ESE HEA TE. EAB, 我 们 曾 述 只 用 三 盘 硫 带 如 何 完 成 2- 路 台 ?j 

HRR D. TQ Ta. ÆT, 上 有 一 个 输入 文件 , 它 将 产生 34 TUB. -种 选择 
是 在 T; 和 T. 的 每 一 盘 伐 带 中 放 和 17 个 顺 串 。 然 后 我 们 可 以 将 结果 合并 到 T, E. 得 到 一 
AA 17 个 吸 串 的 磁带 。 由 于 所 有 的 顺 串 都 在 一 盘 伐 带 上 . 因此 我 们 现在 必须 把 其 中 的 一 些 
顺 串 放 到 T. 上 以 进行 另 一 次 的 合并 。 执行 合并 的 迪 辑 方式 是 将 前 8 ARM T, 15 018 T 
并 进行 合并 . 这样 的 效果 起 对 于 我 们 所 做 的 每 一 趟 合并 又 附 即 了 额外 的 半 趋 式 作 ， 

男 一 种 选择 是 把 原始 的 34 MOU Ey ere op AN. BRIE 21 PE Ta 上 而 
把 13 TB IE] T4 上 。 然 后 , ET, 用 完 之 前 将 13 TUB RESET, Eo At, 我们 可 以 
EERE 了 和 Ta. 然后 将 具有 13 个 顺 串 的 T, 和 8 个 顺 串 的 T 合并 到 TT 上。 此 时 ,我们 
人 台 并 8 个 顺 串 直到 T; 用 完 为 止 , 这 样 ,在 TT 上 将 留 下 5 NARE T. 上 则 有 8 TR 
然后 , 我 们 再 合并 TAT, SS. PaEIB de mon d BEES A CZ I f Ri E e Ag 
个 数 。 


ete 之 后 之 后 2h 之 后 之 后 ü 之 后 2h 












硕 串 最 馈 的 分 配 有 很 大 的 关系 。 例 如 , 车 2 PME T» E. 12 个 在 T4 FE, 则 第 一 
BATS RSA T, 上 的 12 MCR T; 工 的 10 个 顺 串 。 在 另 一 次 合并 后 ,T+ 上 有 10 
^m ;上 有 2 个 顺 串 。 此 时 ,进展 的 速 讶 慢 了 下 来 . 因为 在 Ts 用 完 之 前 我 们 只 能 合并 
PAM. eT, 有 8 个 顺 串 而 To 有 2 个 顺 串 。 同 样 , 我 们 只 能 合并 两 组 顺 串 ， 结 也 T, 
Ho NARH T; 有 2 个 顺 串 。 再 经 过 三 趟 全 并 之 后 ，T: 还 有 2 个 顺 串 而 其 余 伐 带 均 已 没有 有 
任何 内 容 。 我 们 必须 将 一 个 顺 品 拷贝 到 另外 一 盘 厂 带 上 , 然后 结束 合并 。 

S B. 我 们 络 电 的 最 初 分 配 是 最 优 的 。 姐 果 顺 串 的 个 数 是 一 个 斐 波 那 契 数 Fy, 那么 
分 配 这 些 顺 串 最 好 前 方式 是 把 它们 分 裂 成 两 个 辈 波 那 韶 数 Fx -1 和 Fw .z。 否则 , A ORES 
的 个 数 补足 成 一 个 斐 波 那 契 数 就 必须 用 一 些 哑 顺 串 (dummy run) 来 填补 磁带 。 我 们 把 如 何 将 
一 组 初始 顺 串 分 放 到 役 带 上 的 具体 做 法 留 作 练习 。 

可 以 把 上 面 的 做 法 扩充 到 上 路 合并 , 此 时 我 们 需要 第 上 阶 斐 波 那 契 数 用 于 分 配 顺 串 ， 其 
He 阶 辈 波 那 契 数 定义 为 FDCN) = FÜQN - 1) +t FÜQN - 2) + + FP 
(N — &) BRUGES Agee FON) = 0, ONE - 2, FO - D be 
7.11.6 替换 选择 

BOG PO ES EM ERE HE xz 38d 1p, £8 HH B EE REFER m Rf YA: 该 入 
尽 可 能 多 的 记录 并 将 它们 排序 , FURR EDAD RET, h SUÉGECK SUE nf BERI A EERE, 
二 到 实现 只 要 第 一 个 记录 被 写 到 输出 磁带 上 , 它 所 使 用 的 内 存 就 可 以 被 男 外 的 记录 使 用 。 如 
果 输 入 磁带 上 的 下 一 个 记录 比 我 们 刚刚 输出 的 记录 大 , 那么 它 就 可 以 被 放 人 这 个 顺 吕 中: 

利用 这 种 租 法 ,我 们 可 以 给 出 产生 顺 串 的 一 个 算法 , 该 方法 通常 称 为 普 摘 选择 (replace- 
ment selection)。 开 始 ，M 个 记录 被 读 入 内 存 并 被 放 到 一 个 优先 队列 中 。 我 们 执行 一 次 
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DeleteMin, 把 最 小 的 记录 写 到 输出 磁带 上 , 再 从 输 人 磁带 读 人 下 一 个 记录 。 奶 果 它 比 刚 刚 与 
出 的 记录 大, 那么 我 们 可 以 把 它 加 到 优先 队列 中 , 否则, ARABI ERA SS By OB H FÈ 
先 队 列 少 一 个 元 素 , 因此 , 我 们 可 以 把 这 个 新 元 素 存 入 优先 队列 的 死 区 (dead space). TELS 
中 完成 构建 ， 而 该 新 元 秦 用 于 下 一 个 顺 串 。 将 一 个 元 素 存 人 死 区 的 做 法 类 似 于 在 堆 排序 中 的 
做 法 .我 们 继续 这 样 的 步 豫 直 到 优先 队列 的 大小 为 零 , 此 时 该 顺 审 梅 建 完 成 我 们 使 用 死 区 
中 的 所 有 元 素 通 过 建立 一 个 新 的 优先 队列 开始 构建 一 个 新 的 顺 串 。 图 7-18 解释 我 们 正在 使 
MENA TDF HUB AEE, Ap M =3。 CRABS HR. 
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图 7-18 AHER 


存 这 个 例子 中 , 替换 选择 只 产生 3 MER, 这 与 通过 排序 得 到 5 个 顺 串 不 同 。 正 因为 如 
此 ,3- 路 合并 经 过 一 趟 而 非 两 梢 结束 。 如 果 输 入 数据 是 随机 分 配 的 , 那么 可 以 证 明 替 换 选 择 
产生 平均 长 度 为 2M 的 顺 囊 。 对 于 我 们 所 举 的 大 例子 , 预计 为 160 个 顺 串 而 不 是 320 个 顺 
d. 因此, 5 路 合并 需要 进行 4 未。 在 这 个 例子 中 , 我 们 没有 节省 一 趋 , RORIS UTE F 
是 可 以 节省 的 , 我 们 可 能 有 125 或 更 少 的 顺 串 。 由 于 外 部 排序 花费 的 时 间 太 多 , 因此 节省 的 
每 -- 趟 都 可 能 对 运行 时 间 产 生 显 著 的 影响 。 

我 们 已 经 看 到 , 有 可 能 替换 选择 做 得 并 不 比 标准 算法 更 好 。 然 而 ， 输入 数据 常常 从 排序 
或 几乎 从 排序 开始 ,此 时 蔡 换 选择 仅仅 产生 少数 非常 长 的 顺 串 。 这 种 类 型 的 输入 通常 要 进行 
外 部 排序 , 这 就 使 得 替换 选择 具有 特殊 的 价值 : 


总 结 


对 于 最 一 般 的 内 部 排序 应 用 程序 , 选用 的 方法 不 是 插入 排序 、 希 尔 排序 ,就 是 快速 排序 ， 
它们 的 选用 主要 是 根据 输入 的 大 小 来 决定 。 图 7-19 显示 每 个 算法 (在 一 台 相对 较 慢 的 计算 机 
上 ) 处 理 各 种 不 同 大 小 的 文件 时 的 运行 时 间 : 

选择 N 不 整数 组 成 一 些 随 机 排列 ， 而 表 中 给 出 的 各 项 仅仅 是 排序 的 实际 时 间 。 图 7-2 给 
出 的 程序 用 于 插入 排序 。 希 尔 排 序 使 用 7.4 节 中 的 程序 , 该 程序 改 为 使 用 Sedgewick iiz 
行 。 基 十 数 以 百 万 计 次 排序 , 大 小 从 100 到 2 500 0000 不 等 , 使 用 这 种 增 量 的 希 尔 排序 预计 
的 运行 时 间 估计 为 OCN4)。 堆 排序 例 程 与 7.5 节 中 的 相同 。 表 中 给 出 两 种 快速 排序 算法 。 
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j| 10 | 0.00044 0 00041 0.000832 1 — .00046 y 
| 100, 0.00675 000171 | 000420 | 0.00284 | — .00244 1 
| mo} 0.59564 0.02927 ! 0.05565 0.03133 | .02587 

H — 10000 | 58.864 042998 | — 0.71650 0.36765 | 31532 | 
, 00000 | NA 3.7298 |! 8.8591 4. wl 3. 2 

! 104,68 47 os | 41.282 m | 


图 7-19 7 [ele HERR RE EB HC RC A Beet EQ ENT) 


第 -种 使 用 简单 的 枢纽 元 方法 ， men M FARE, 这 些 输入 文件 是 随机 的 .第 二 种 使 
用 三 数 中 值 分 着 法 , 截止 范围 为 10， 进 : - 步 的 优化 还 中 有 可 能 的 ， 比 刀 我 们 可 以 与 一 个 内 线 
RCI DIEM ERROR. fetrerpUd 一 个 非 递归 的 快速 排序 .还 存在 其 他 
- - 些 方法 对 代码 进行 优化 ,它们 实现 起 米 相 当 复 杂 , 当然 , 我 们 也 可 使 用 汇编 语言 编程 。 我 
们 已 有 打算 友 效 地 编写 所 有 的 合 程 ,不 过 , 性 能 内 机 器 不 同 当 然 多 少 会 有 些 变 化 

高 度 优化 的 快速 排序 算法 即使 对 于 很 少 的 输入 数据 也 能 和 项 尔 排 序 一 样 快 ， 快 速 排 序 的 
改进 算法 仍然 有 O(N?) 的 最 坏 情 况 ( 有 一 -个 练习 让 你 构造 一 个 小 例子 ), 但 是 , 这 种 最 坏 情形 
出 天 的 机 会 是 如 此 地 微不足道 ， 以 至 于 不 能 成 为 影响 算法 的 因素 。 如 果 需 时 对 一 些 大 型 的 文 
(HERE, 那么 快速 排序 则 是 应 该 选用 的 方法 。 但 是 , 水 远 都 不 要 图 省 事 而 轻易 把 第 -个 元 素 
用 作 枢 钮 元 。 对 输入 数据 随机 的 假设 是 不 安全 的 。 如 果 你 不 模 过 多 地 考虑 这 个 问题 , BATE 
ABARA. A HERA hiki. 不 过 还 是 可 以 接受 的 , 特别 是 需要 简单 明了 的 时 
候 、 希 尔 排序 的 最 坏 情况 也 只 不 过 是 ON) RAREN ALE LBD CIE. 

堆 排 序 要 比 希 尔 排序 慢 ,尽管 它 是 :个 带 有 明显 紧凑 内 循环 的 O(N log N) 算 法， 对 该 
算法 的 深入 考查 揭示 , 为 了 移动 数据 , 堆 排序 要 进行 随 次 比较 。 由 Floyd 提出 的 改进 算法 移 
动 数据 基本 于 只 沉 要 一 次 比较 ,不 过 实现 这 种 改进 算法 使 得 代码 多 少 要 长 一 些 : AXE 
冶 读者 来 决定 这 种 附加 的 编程 代价 用 以 提高 速度 是 否 值 得 (练习 7.40). 

插 人 排序 只 用 在 小 的 或 是 非常 接近 排 好 序 的 输 人 数据 上 。 我们 没有 包括 进来 归并 排序 ， 
因为 它 的 性 能 对 于 主 存 排序 不 如 快速 排序 那么 好 , 而 自 它 的 编程 一 点 也 不 省 事 。 然 而 我 们 已 
经 看 到 , 合并 却 昆 外 部 排序 的 中 心思 想 - 


练习 


7.1 使 用 插入 排序 将 序列 3, 1, 4,1, 5,9, 2, 6, 5 排序. 

212 旭 果 所 有 的 关键 字 都 相等 ,那么 插 人 排序 的 运行 时 间 是 多 少 ? 

7.3 设 我 们 交换 元 素 AL IAAL) + Rl. 它们 最 初 是 无 序 的 . 证 明 去 掉 的 道 序 最 少 为 
1 个 最 多 为 2k - IF, 

7 4 生出 使 用 增 量 }1, 3, 71 对 输入 数据 9, 8, 7, 6, 5, 4. 3, 2. 1 运行 希 尔 排序 得 到 的 结果 。 

7.5 a. 使 用 2- 增 量 序列 i1, 2; 的 希 尔 排序 的 运行 时 间 是 多少 
b. 证 明 , 对 任意 的 N, 存在 一 个 3- 增 量 序 列 , 使 得 希 尔 排 序 以 CON ”) 时 则 运行 
c. 证明 , 对 任意 的 N, 存在 一 个 6- 增 量 序列 , 使 得 希 尔 排 夺 以 OCNT7 INTE TT 

+ 6 xa 证 明 , ADEA L, c, c ooo ec 的 增 量 , 希 尔 排序 的 运行 时 间 为 AON), 其 

H, c 为 任 一 整数 。 





* *b. 证 明 , 对 于 这 些 增 量 , 平均 运行 时 间 为 (N77). 


«7.7. 证 明 , 若 一 个 排序 的 文件 而 后 被 A 排序, 则 它 仍 是 排序 的 。 

x #7 了,8 证 明 , 使 用 由 Hibbard 建议 的 增 量 序列 的 希 尔 排 序 在 最 坏 情 形 下 的 运行 时 间 是 
QUN?2) ,提示 : 可 以 证 明 当 所 有 的 元 素 不 是 0 就 是 1 时 希 尔 排序 这 种 特殊 情形 C57 
的 时 间 界 。 如 果 i; 可 以 表 为 有, hy a, s. Alege 1 的 线性 组 合 , 则 可 置 Input- 

Data[ i] = 1, 否则 置 为 0。 
7.9 “确定 希 尔 排 序 对 于 下 述 输入 的 运行 时 间 ; 


7.1 
7.12 


7.13 


7.14 
7.15 


7.16 


7.17 
7.18 


7.19 


7.20 


本 
c molt 


a， 排 过 序 的 输入 数据 
*b. 反 序 排列 的 输入 数据 
下 述 两 种 对 图 7-4 所 编写 的 希 尔 排 序 例 程 的 修改 影响 最 坏 情 形 的 运行 时 间 坦 ? 
a. 如 时 Increment 是 侦 数 ， 则 在 第 2 行 前 从 Increment 减 1。 
b. 如 果 Increment 是 偶数 , 则 在 第 2 行 前 往 Increment 加 1。 
指出 堆 排 序 如 何 处 理 输 入 数据 142, 543, 123, 65, 453, 879, 572, 434, 111, 242, 811, 102. 
a. 对 于 预 排序 的 输入 数据 , 堆 排 序 的 运行 时 间 是 多 少 ? 


"b. 证 明 , 堆 排 序 的 最 坏 情 形 的 界 是 可 以 达到 的 。 


用 扫 并 排序 将 3, 1, 4, 1, 5, 9, 2, 6 排序 ， 

不 使 用 递归 如 何 实 现 归并 排序 ? 

懈 定 对 下 列 数据 进行 归并 排序 的 运行 时 间 : 

a. 排 过 序 的 输入 数据 

b. 反 序 排列 的 输入 数据 

c. 随机 的 输入 数据 

在 归并 排序 的 分 析 中 是 不 考虑 常数 的 。 证 明 , 归并 排序 在 最 坏 情形 下 用 于 比较 的 
次 数 为 N[jog N] 一 25595 1. 

用 三 数 中 值 分 割 法 以 及 截止 为 3 的 快速 排序 将 3,，1, 4, 1, 5, 9, 2, 6, 5, 3, 5 HEP, 
使 用 本 章 中 的 快速 排序 实现 方法 确定 下 列 输入 数据 的 快速 排序 运行 时 间 :; 

a. 排 过 序 的 输入 数据 

b. 反 序 排列 的 输入 数据 

c. 随机 的 输入 数据 

当 枢 纽 元 被 选 作 下 询 元 素 时 重复 练 寺 7. 18: 

a. 第 一 个 元 素 

b. 前 两 个 互 异 关键 字 中 的 最 大 者 

一 个 随机 元 素 

在 该 输入 集合 中 所 有 关键 字 的 平均 值 

对 于 本 音 中 快速 排序 的 实现 方法 ， 当 所 有 的 关键 字 都 相等 时 它 的 运行 时 间 是 多 少 ? 

.假设 我 们 改变 分 割 策 略 使 得 当 找到 一 个 与 枢纽 元 相同 的 关键 字 时 i 和 j 部 不 
停止 。 当 所 有 的 关键 字 都 相等 时 ， 为 了 保证 快速 排序 正常 工作 ,需要 对 程序 做 
哪些 修改 ”运行 时 间 是 多 少 ? 558] 

c 假设 我 们 改变 分 割 策 略 使 得 在 ~…. 个 与 枢纽 元 相同 的 关键 字 处 i 停止, 但 是 7 

在 类 似 的 情形 下 却 不 停止 。 为 了 保证 快速 排序 正常 工作 , 需要 对 程序 做 哪些 
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- 
n3 
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7.29 


7.36 


fg 当 所 有 的 关键 学 都 相等 时 , 快速 排序 的 运行 时 间 是 多 少 ? 
妈 我 们 选择 中 国 的 关键 字 作 为 桃 纽 汇 。 这 是 否 使 得 快速 排序 将 不 可 能 击 要 二 次 时 间 ? 
构造 刃 个 元 素 的 一 个 排列 使 得 对 于 := 数 中 人 才 分 当 旧 截止 为 BSR, PBS ny ee, 
编写 一 个 程 厅 实现 选择 算法 ， 
求解 下 列 递 推 关系 ;: TUN) = (1AN)[2) TOD] + oN, TO) = 0. 
如 果 一 切 具 有 相等 关键 字 的 元 率 孝 保持 它们 在 输 人 数据 时 呈现 的 顺序 , 那么 这 种 排 
序 算 法 就 是 稳定 的 {stable}。 本 章 中 的 排序 算法 哪些 是 稳定 的 ? 哪些 不 是 ?为 1 io 
设 给 定 ON THESE ACE, GRA ON) T BEULIRFFIBSIZUR c AUR SON) 
列 情 况 ， 那么 如 何 将 全 部 数据 排序 ? 
a. f(N) = O(1)7 
b. FON) = O(log N)? 
c. f(N) = O(/ N)? 
"d. FON) E KTEIS 4 BB S EA BERELA OCN ) 时 间 排 序 ” 
证 明 ; 在 N 个 元 素 排 过 序 的 表 中 找 出 一 个 元 素 X 的 任何 算法 都 需要 Ndg NRA 
利用 Stirling 公式 N! (N/Ve)N v2xN 给 出 log (NN1) 的 精确 估计 。 
*a. 两 个 排 过 序 的 NN 个 元 素 的 数组 有 多 少 种 合并 的 方法 ? 
*b, 给 出 合并 两 个 N 个 元 素 的 排 过 序 的 数组 所 天 要 的 比较 次 数 的 非 平 几 下 沉 ， 
证 明 , 使 用 桶 式 排序 把 具有 范围 在 LES bey M 内 的 整数 关键 宁 的 NN 个 元 素 排 序 
需要 时 间 OLM + N): 
BAN 个 元 素 的 数组 只 包含 两 个 不 同 的 关键 字 trae 和 false。 给 出 :个 ODN) 算 
法 , 重新 排列 这 些 元 素 使 得 所 有 false 的 元 素 都 排 在 true 的 元 素 的 前 面 ， 你 只 能 
使 用 常数 附加 空间 。 
设 有 N 个 元 素 的 数组 包含 三 个 不 同 的 关键 宁 true, false 和 maybe. 给 出 一 个 O 
(MER, 重新 排列 这 些 元 素 , 使 得 所 有 false 的 元 系 都 排 在 maybe RAMA, 
而 maybe ILA ARTE true 元 素 的 前 面 。 你 只 能 使 用 常数 附加 空间 。 
a. WHA, 任何 基于 比较 的 算法 将 4 个 元 素 排序 均 害 $5 次 比较 。 
b. 给 出 一 种 算法 用 5 次 比较 将 4 个 元 素 排序 。 
a. 证 明 ; 使 用 任何 基于 比较 的 算法 将 5 个 无 素 排序 都 需要 7 次 比较 。 


“和 给 出 一 个 算法 用 7 次 比较 将 5 个 元 素 排 序 。 


写 出 一 个 有 效 的 希 尔 排序 算法 并 比较 当 使 用 下 列 增 基 序列 时 的 性 能 : 
a. 希 尔 的 原始 序列 
b. Hibbard 的 增 量 


c. Knuth 的 增 量 : k= 方 (3 + 1) 





d. Gonnet 的 增 量 : h =l SJ ii h 一 上 262 GR A47 20] A= 1) 

e. Sedgewick 1# Œ 

实现 优化 的 快速 排序 算法 并 用 下 列 组 合 进 行 实 验 : 

a. 枢纽 元 ; 第 一 个 元 素 , 中 间 的 元 素 , 随机 的 元 素 ， 三 数 中 值 , 五 数 中 值 。 


oF 


b. 截止 值 从 0 到 20: 
7.37 编写 一 个 例 程 读 人 两 个 用 字母 表示 的 文件 并 将 它们 合并 到 一 起 , 形成 第 三 个 也 是 
HFE RERI IE. 
7 38 ” 设 我 们 实现 二 数 中 值 例 程 如 下 : 找 出 AL Left], Al Center) A A[ Righe btia, 
HEE S AL Rihi 交换 .以 通常 的 分 荐 方法 进行 , 开始 时 ;在 Left 处 且 ) 在 
Right 一 1 处 {而 不 是 Left + 1 和 Right — 2). 
a. 设 输入 为 2, 3, 4,...,，N - V, N, 1。 对 于 沪 输 入 , 这 种 快速 排序 算法 的 运 
AT AY fal Fb eb? 
b. idi ARES RAPES OFA, 这 种 快速 排序 算法 的 运行 时 间 又 证 多 少 ” 
7.39 证 明 : 任何 基于 比较 的 排序 算法 前 需要 平均 O Niog N) 次 比较 。 
7.40 "EHE FIBI) PercolateDown 算法 。 我 们 在 节点 苇 有 一 个 空 六 (hole). 普通 的 例 程 是 比 
较 X 的 儿子 然后 把 比 我 们 将 要 放置 的 元 素 大 的 儿子 上 移 到 针 处 (在 (mar) 堆 的 情形 
T). 中 此 将 空 穴 下 推 ; 当 把 新 元 来 安全 让 到 室 闪 中 时 我 们 终 目 算法。 用 一 种 方法 是 
将 元 素 上 移 且 空 穴 尽 可 能 地 下 移 ,， 不 用 测试 是 否 能 够 插入 到 新 单元 - 这 将 使 得 新 单 
元 被 放置 到 一 片 树叶 上 并 可 能 破坏 堆 序 ; 为了 修复 堆 序 ,以 通常 的 方式 将 新 单 才 上 
滤 。 写 出 包含 该 想法 的 例 程 ,并 与 标准 的 玲 排 序 实 现 方法 的 运行 时 间 进 行 比较 
7.41 提 岂 一 种 算法 ,只 用 两 盘 磁 带 对 一 个 大 型 文件 进行 排序 : 
7.42 a. 道 过 建 堆 (build-heap)} 最 多 使 用 2N c MSR SR SC HE HELME RN! 7 
2-… , 
b. 利用 Stirling 公式 扩展 该 界 . 
7.43 ANSI C 要 求 例 程 gsort 出 现在 C 函数 库 中 ，qsort 由 快速 排序 典型 算法 实现 (但 这 
不 是 必须 的 )， 通 过 备 种 输入 数据 进行 实验 观察 是 否 asort 能 够 出 现 二 次 的 特性 . 
用 一 些 随机 的 0 和 1 测试 。 
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决策 树 和 排序 优化 在 Ford fl Johnson 3] Pie. 这 篇 论文 还 提供 了 一 个 算法 , 它 儿 乎 符合 


用 比较 (而 不 是 其 他 操作 ) 次 数 表 未 的 上 下界。 该 算法 最 后 由 Manacher 12 | 指出 稍 阳 于 最 优 。 


外 部 排序 及 其 细节 涵盖 于 |11].. 在 练习 7.25 中 描述 的 稳定 排序 算法 已 由 Horvath[81 提 出 . 
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第 8 章 不 相交 集 ADT 


在 这 一 章 , 我 们 描述 解决 等 价 问题 的 一 种 有 效 数 据 结构 。 这 种 数据 结构 实现 起 来 简单 ， 
每 个 例 程 只 央 要 几 行 代码 , 闪 且 可 以 使 用 一 个 简单 的 数组 。 它 的 实现 也 非常 地 快 , 每 种 操作 
只 需要 前 数 平 均 时 间 。 从 理论 上 看 , 这 和 神 数 据 结构 还 是 非常 有 趣 的 ,内 为 它 的 分 析 极 其 朵 
XE. 最 坏 情 况 的 函数 形式 不 同 于 我 们 已 经 见 过 的 任何 形式 、 对 于 这 种 不 相交 集 ADT, 我 们 将 

© 讨论 如 何 能 够 以 最 少 的 编程 代价 实现 ， 

e 通过 两 个 简单 的 观察 极 大 地 增加 它 的 速度 。 

e 分 析 一 种 快速 的 实现 方法 的 运行 时 间 . 

e 介绍 一 个 简单 的 应 用 . 


8.1 等 价 关系 


车 对 于 每 一 对 元 素 (a ,5), a, bE S, aRb 或 者 为 true 或 者 为 false， 则 称 在 集合 S LE 
XX É(relation R. 4È aRb 是 true, 那么 我 们 说 a 55 XX. 

等 价 关系 (equivalence relation) 是 满足 下 列 二 个 性 质 的 关系 R: 

I. CE RIED T PTS II a€ S, aRa. 

2.( 对 称 性 yaRp SAIL bRa 

3 传递 性 } 若 aRb 旦 5Rc 则 aRe。 

我 们 将 考虑 几 个 例子 : 

关系 “所 ”不 是 等 价 关 系 。 虽然 它 是 自 反 的 ( 即 axa), 可 传递 的 ( 即 由 asco Abse 得 
Baze), 但 它 却 不 是 对 称 的 , 因为 从 es 并 不 能 得 出 se 。 

电气 连通 性 (electrical connectivity) 是 -一 个 等 价 关 系 ， 其 中 所 有 的 连接 都 是 通过 金属 导线 
完成 的 。 该 关系 显然 是 自 反 的 , 因为 任何 元 件 都 是 白 身 相连 的 。 如 果 a BAERS, 那么 
5 必然 了 由 电气 连接 到 a。 最 后 ,如果 a 连接 到 5, 而 5 又 连接 到 <, 那么 a 连接 到 <。 因 此 , 电 
气 连接 是 一 个 等 价 关 系 。 

如 果 两 个 城市 位 于 同一 个 国家 , 那么 定义 它们 是 有 关系 的 。 容 易 验 证 这 是 一 个 等 价 关 
系 。 如 果 能 够 通过 从 路 从 城镇 a TED, 则 设 a 与 5 有 关系 如果 所 有 的 道路 都 是 双 疝 行 
驶 的 . 于 么 这 种 关系 也 是 一 个 等 价 关 系 ， 

8.2 动态 等 价 性 问题 

给 定 -- 个 等 价 关 系 “~”, 一 个 白 然 的 问题 是 对 任意 的 a Mo, REER aco. WAR 
等 价 关系 存储 为 一 个 二 维 布尔 数组 ， 那 么 当然 这 个 工作 可 以 以 常数 时 间 完成 。 问 题 在 于 , 这 
种 关系 的 定义 通常 不 明显 而 是 相当 隐秘 。 

作为 一 个 例子 , 设 在 5 PITH ABA lai. azn ap aas as! 上 定义 一 个 等 价 关系 。 此 时 
Ak 25 对 元 素 , 它们 的 每 一 对 或 者 有 关系 或 者 没有 关系 。 然而, fe al 一 a2, 037 a4, 
as~ aj, a4~ es 意味 着 每 一 对 元 素 都 是 有 关系 的 。 我 们 希望 能 够 迅速 推 斯 出 这 些 关 系 。 

一 个 苞 素 a € S HF tt & (equivalence clas) i S 的 一 个 子 集 , fu PT a 有 关系 的 


Es 
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Ju HER, 等 价 类 形成 对 S 的 一 个 划分 : SHARP RARER T SERAIS HU A 
EER a 一 5, 我们 内需 验证 a Ab 基 舍 部 在 同一 个 等 价 类 中 。 这 给 我 们 提供 了 解决 等 价 问 
SES E. 

输入 数据 最 初 是 N DRAW (collection), 每 个 集合 含有 一 个 元 类。 初始 的 描述 是 所 有 
的 关系 均 为 false 自 反 的 关系 除外 )。 每 个 集合 都 有 一 个 不 同 的 元 素 , 从 而 SAS = 0: 这 使 
得 这 些 集 合 不 相交 (disjoint) ， 

此 时 , 有 两 种 运算 允许 进行 。 第 一 种 运算 是 Find, CREMER AETR RRE A 
类 ) 的 和 名字。 第 二 种 运算 是 添加 关系 ,， 如 果 我 们 想 要 添 而 关系 a ~ b, WARME EHAE 
Ta 和 5 已 经 有 关系 ， 这 可 以 通过 对 a 和 5 执行 Find 并 检验 它们 基 否 在 同一 个 等 价 炎 中 来 
ZR. WRENNER AB, 那么 我 们 使 用 求 并 运算 Union, 这 种 运算 把 富有 4a 和 的 两 
个 等 价 类 合并 成 一 个 新 的 等 价 类 。 从 集合 的 观点 来 看 ，U 的 结果 是 建立 一 个 新 集 从 Si 一 S 
US. 去 掉 原 来 两 个 集合 而 保持 所 有 的 集合 的 不 相安 性 ， 由 于 这 个 原因 ,常常 把 做 这 项 工作 
的 算法 叫做 不 相交 集合 的 Cnion/Find JE; ; 

该 算法 是 动态 的 (dynamic), 内 为 在 算法 执行 的 过 程 中 ， 集合 可 以 通过 Union 运算 而 发 生 
改变 ， 这 个 算法 还 必然 是 联机 {on-line) 操 作 :; 当 Find 执行 时 , 它 必 须 给 出 答案 算法 才能 继 乡 
进行 。 另 一 种 可 能 是 脱 机 (off-line) 算 法 ,该 算法 需要 观察 全 部 的 Union 和 Find RR. ER 
个 Find 给 出 的 答案 必须 和 所 有 执行 到 该 Find 的 Union 一 致 ， 而 该 算法 在 看 到 所 有 的 问题 以 
后 再 给 出 它 的 所 有 的 答案 。 这 种 差别 类 似 于 参加 一 次 笔试 ( 它 一 般 是 脱 机 的 一 一 你 只 能 在 规 
定 的 时 疗 用 完 之 前 给 叶 答 卷 ) 和 一 次 口试 ( 它 基 联机 的 ， 因为 你 必须 问答 当前 的 问题 , 然后 才 
能 继续 下 一 个 问题 )， 

注意 , 我 们 不 进行 任何 比较 元 素 相 关 的 值 的 操作 , 而 是 只 宕 要 知道 它们 的 位 置 。 由 于 这 
个 原因 ,我们 假设 所 有 的 元 素 均 已 从 1 到 N 顺序 编导 并 且 编 号 方法 容易 由 某 个 若 列 方案 确 
E. TE, 开始 时 我 们 有 S= ;ij ,i=1 到 NN。 

我 们 的 第 二 个 观察 是 , 由 Find 返回 的 集合 的 各 字 实 际 上 是 柑 当 任意 的 。 真 正 重 要 的 大 
RETF: Find(a) = Find HHAH a Hib 在 同一 个 集合 中 。 

这 些 运 算 在 许多 图 论 问题 中 是 重要 的 ,在 一 些 处理 等 价 (或 类 型 ) 声 明 的 编译 程序 中 也 很 
重要 ， 我 们 将 在 后 面 讨论 一 个 应 用 。 

解决 动态 等 价 问题 的 方案 有 两 种 。 一 种 方案 保证 指令 Find 能 够 以 常数 最 坏 情形 运行 时 
间 拱 行 ， 而 另 一 种 方案 则 保证 指令 Union 能 够 以 常数 最 坏 情形 运行 时 间 执 行 。 最 近 有 人 指出 
二 者 不 能 同时 做 到 : 

我 们 将 简要 讨论 第 一 种 处 理 方 法 。 为 使 Find 和 运算 快 ， 可 以 在 一 个 数组 中 保存 每 个 无 素 
的 等 价 类 的 名 字 。 此 时 ,Find 就 是 简单 的 O(1) 和 查找 。 设 我 们 想 要 执行 Unionta， b), Fit a 
在 等 价 类 i 中 而 5 在 等 价 类 ; 中 。 然 后 我 们 扫描 该 数组 , 将 所 有 的 i 改变 成 }。 不 过 ,这 次 扫 
措 更 花费 (CN) 时间。 于 是 , 连续 N 一 1 次 Union 操作 (这 是 最 大 值 , 内 为 此 时 每 个 元 素 部 
在 一 个 集合 中 ) 就 要 花费 O(N RU. MRE QUN? IX, Find 运算 ,那么 性 能 会 很 好 ， 
因为 在 整个 算法 进行 过 程 中 每 个 Find 或 Union 运算 的 总 的 运行 时 间 为 OC. HIA Find is 
算 没 有 那么 多 , 那么 这 个 界 是 不 可 接受 的 ; 

种 想法 是 将 所 有 在 同一 个 等 价 类 中 的 元 素 放 到 一 个 链表 中 。 这 在 更 新 的 时 候 会 节省 时 
间 ， 因 为 我 们 不 必 搜 索 整 个 数组 : 但 昆 由 于 它 在 算法 过 程 中 仍然 可 能 执行 ON UAE OTH 
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的 更 新 , 因此 它 本 了 本 并 不 能 单独 减少 痢 进 运行 时 间 

姐 昌 我 们 还 要 蹊 踪 每 个 等 俐 类 的 大 小 , 并 在 执行 Union 时 将 较 小 的 等 价 类 的 名字 改 成 较 
大 的 等 价 类 的 名 字 , 那么 对 于 N ~ 1 次 合并 的 总 的 时 间 开 销 为 OCN log ND; HUE T, 
每 个 元 素 可 能 将 它 的 等 价 类 最 多 改变 log NK, 因为 每 次 它 的 等 价 类 改变 时 它 的 新 的 等 独 类 
至 少 是 它 的 原来 等 恒 类 的 两 倍 大 。 使 用 这 种 方 沪 , 任意 顺序 的 M 次 Find 和 直到 NN 一 1 次 
的 Union RAER OCM + N log N) 时 间 。 

在 本 章 的 其 余部 分 , 我 们 将 考查 Union/Find (ERES — 8p RETE , 其 中 Union xd A B 
Find 运算 贤 难 一 些 。 即 使 如 此 , 任意 顺序 的 最 多 M 次 Find 和 直到 N 一 上 次 Union 的 运行 
时 间 将 只 比 O(M + NT) 多 一 点 。 


8.3 基本 数据 结构 


记 往 , 我 们 的 问题 不 要 求 Find 操作 返回 任何 特定 的 名 宁 , 而 只 是 要 求 当 且 仅 当下 个 元 素 
属于 相同 的 集合 时 ， 作 用 在 这 两 个 元 素 上 的 Find 返回 相同 的 名 字 。- -种 想法 是 可 以 使 用 树 
来 表示 每 一 个 集合 ， 因 为 树 上 的 每 一 个 元 素 都 有 相同 的 根 。 这 样 ， 该 恨 就 可 以 用 来 命名 所 在 
的 集合 。 我 们 将 用 树 表 示 每 一 个 集合 。{ 记 住 , 树 的 集合 叫做 森林) 此 好 时 每 个 集合 含有 一 
个 元 素 。 我 们 将 要 使 用 的 这 些 树 不 一 定 必须 是 二 丸 树 , 但 是 表示 它们 要 容易 , BARN 
的 惟一 信息 就 是 一 个 父 指针 。 集合 的 名 字 由 根 处 的 节点 给 出 。 由 于 只 需要 父 节点 的 名 字 ， 因 
此 我 们 可 以 假设 树 被 非 显 式 地 存储 在 一 个 数组 中 : 数组 的 每 个 成 员 PL i 表示 元 素 i 的 父 杀 。 
如 果 ; BUB. 那么 PEi] = 0。 在 图 8-1 的 森林 中 , 对 于 1 所 i 去 8, P[;] = 0. EAEE PAR 
样 .我 们 也 将 显 式 地 画 出 这 些 树 , 注意 , 此 时 正在 使 用 一 个 数组 。 图 8-1 表达 了 这 种 显 式 的 
表示 方法 ,为 方便 起 见 , 我 们 将 把 根 的 父 指 针 垂 可 男 出 。 


SOOOOOOO 


El 八 个 元 素 , 最 初 是 在 不 同 的 集合 上 


YT PUT MEAD Union 运算 , 我 们 使 一 个 节点 的 根 指针 指向 另 - - 棵 树 的 根 节点 。 显 
Ro 这 种 操作 花费 常数 时 间 。 图 8-2, 8-3 和 8-4 分 别 表示 在 Union(5, 6). Union(7, 8)ff 
Union(5, 7) 后 的 森林 ,， 其中, 我们 采纳 了 在 Union X, Y) 后 新 的 根 是 X MAS. RAN FE 
林 的 非 显 式 表 示 见 图 8-5。 


DODOA OF 


图 82 dE Union(5, 6) 之 后 


RE 区 的 一 次 Find{X) 操 作 通 过 返回 包含 X 的 树 的 根 而 完成 。 执 行 这 次 操作 花费 的 
Ms sm X 的 节点 的 深度 成 正比 ,当然 这 要 假设 我 们 以 常数 时 间 找 到 表示 X 的 和 节点。 使 


| 


E 8.3 JF Lnion(7, $3) 之 后 


ILI 


图 上 4 dE Union(5, DZE 
PP Pl ls]] 
1 2 3 4 5 6 7 8 
图 85 .上面 的 树 的 韭 显 式 表 示 


用 上 面 的 方法 , 能 够 建立 - 棵 深度 为 N — 1 的 树 , 使 得 一 次 Find 的 最 坏 情 形 运行 时 则 是 
O(N), 一 般 情况 , 运行 时 间 是 对 连续 泥 合 使 用 M 个 指令 来 计算 的 。 在 这 种 情况 下 ，M URE 
续 操 作 在 最 坏 情 形 下 可 能 花费 ONWN) 时 间 : 

el 8.6 到 图 8-9 中 的 程序 表示 基本 算法 的 实现 , 假设 差错 检验 已 经 执行 。 在 我 们 的 例 程 
中 , 这 些 Union 是 在 这 些 树 的 根 上 进行 的 。 有 了 时候 运算 是 通过 任意 两 个 元 素 进 行 , 并 使 得 
Union 执 行 两 次 Find 以 确定 这 些 根 。 


#ifndef | DisjSet H 


typedef int DisjSet[ NumSets + 1 ]; 
typedaf int SetType; 
typedef int ElementType; 


void Initilializet DisjSet 5 5; 
void SetUnion( DisjSet 5, SetType Rootl, SetType Root2 3; 
SetType Find( ElementType X, DisjSet 5 2; 


endif /* DisjSet_H */ 





图 8-6 不 相交 集合 的 类 型 声明 


平均 时 间 分 析 是 相当 困难 的 。 最 起 三 的 问题 是 党 案 依赖 于 如 何 定义 (对 Union 操作 而 言 
26) 的 ) 平 均 。 例 如, 在 图 8.4 的 琳 林 中 ,我 们 可 以 说 , 由 于 有 SARE, 因此 下 一 个 Union 就 存在 
l| 5-4 = 20 个 等 可 能 的 结果 (因为 任意 两 村 不同 的 柑 都 可 能 被 Union)。 当 然 ， 这 个 模型 的 全 


义 在 十 ,只 存在 专 的 机 会 使 得 下 一 次 Union 小 及 到 大 树 。 另 一 种 贷 型 可能 会 认为 在 不 同 的 权 


Initialize( DisjSet 5) 
{ 


int 3; 


for( i = NumSets: 1 > D; i-- 3 
s[ i] = 0; 





图 8-7 不 相交 集合 的 初始 化 例 程 


/* Assumes Rootl and Root? are roots */ 
/* woion is 4 C keyword, so this routine */ 
/* 18 named SetUnion */ 


void 
Setunian( DisiSet 5, SetType Rootl, SetType Root? ) 


S[ Root? ] = Rootl; 





图 8-8 Union( 不 是 最 好 的 方法 ) 














SetType 
Find( ElementType X, DisjSet S > 


if SEX 1 «4 0 3 
return X; 


else 
return Finde SF X 1, 5 3: 


图 8-9 一 个 简单 不 相交 集合 Find 算法 


上 任意 两 个 元 素 间 的 所 有 Union 都 是 等 可 能 的 ， 因 此 大 树 比 小 树 更 有 可 能 在 下 一 次 Union 中 
OME LIE, 有 号 的 机 会 大 树 在 下 一 次 Union 中 会 被 涉及 到 ， 因 为 (忽略 对 称 
性 ) 存 在 6 种 方法 合并 11, 2, 3, A PRATELA 16 种 方法 将 15，6，7， SEPA PR 
Sil, 2, 3, 4} 中 的 一 个 元 素 合并 。 还 存在 更 多 的 模型 ,而 在 何者 为 最 好 的 问题 上 没有 一般 
的 一 致 见解 。 平 均 运行 时 间 依赖 于 模型 ; 对 于 三 种 不 同 的 模型 , 时 间 界 9(M), @(M log N) 
以 及 日 ( MN) 实际 上 已 经 证 明 , 不 过 , 最 后 的 那个 界 重 现实 坚 。 

对 一 系列 操作 的 二 次 (quadratic) 运 行 时 间 一 般 是 不 可 接受 的 。 可 幸 的 是 ， 有 几 种 方法 容 
易 保证 这 样 的 运行 时 间 不 会 出 现 。 
8.4 灵巧 求 并 算法 | 

ETA Union 的 执行 是 相当 任意 的 ， 它 通过 使 第 二 棵 树 成 为 第 一 称 央 的 子 树 而 完成 台 
并 。 对 其 进行 简单 改进 是 借助 任意 的 方法 打破 现 有 关系 ,使得 总 让 较 小 的 树 成 为 较 大 的 树 的 
子 树 ; 我 们 把 这 种 方法 叫 微 按 大 小 求 并 (union-by-size)。 前 面 例子 中 三 次 Union 的 对 象 大 小 
都 是 一 样 的 , 因此 我 们 可 以 认为 它们 都 是 按照 大 小 执行 的 。 假 如 下 一 次 运算 是 Union(4, 5), 
那么 结果 将 形成 图 8-10 中 的 森林 。 倘 若 没有 对 大 小 进行 探测 而 直接 Union, 那么 结果 将 会 形 








上 成 更 深 的 树 ( 图 8-11). 


5d 5 


0 (OC 


图 8-10 按 太 小 求 并 的 结果 


o 66 wu 


图 8-11 进行 一 次 任意 的 并 的 结果 


我 们 可 以 证 明 ， 如 果 这 些 Union 都 是 按照 大 小 进行 的 , 那么 任何 节点 的 深度 均 不 会 超过 
log Nok, 首先 注意 节点 初始 处 于 深度 0 的 你 置 。 当 它 的 深度 随 痢 一 次 Union 的 结 林 而 增 
加 的 时 候 , 该 节点 则 被 置 于 至 少 是 它 以 前 所 在 树 两 倍 大 的 一 棵 树 上 。 因 此 , 它 的 深度 最 多 可 
以 增加 leg N 次 。( 我 们 在 8.2 和 节 末 尾 的 快速 查找 算法 中 用 过 这 个 论断 , CER, Find te 
作 的 运行 时 间 是 O(log N), 而 连续 M 次 操作 则 花费 口 (M log N)。 图 8-12 中 的 树 指出 在 
16 次 Union 后 有 可 能 得 到 这 种 最 坏 的 树 , 而 旦 如 果 所 有 的 Union ABATE AC OBE, #8 
么 这 样 的 树 是 会 得 到 的 (最 坏 情形 的 树 是 在 第 6 童 讨论 过 的 二 项 树 )。 





图 8-12 N = 16 时 最 坏 情 形 的 树 


为 了 实现 这 种 方法 ,我们 需要 记 住 每 一 棵 树 的 大 小 。 由 于 我 们 实际 上 只 使 用 一 个 数组 ， 
因此 吕 以 让 每 个 根 的 数组 元 素 包含 它 的 树 的 大 小 的 负 值 。 这 样 一 来 , 初始 时 树 的 数组 表示 就 
都 是 -~ 1 了 (而 图 8-7 则 需要 进行 相应 的 改变 )。 当 执行 一 次 Union 时 , 要 检查 树 的 大 小 ; 新 
的 大 小 是 老 的 大 小 的 和 。 BORE, 按 大 小 求 并 的 实现 根本 不 存在 困难 , 并 且 不 需要 额外 的 空 
hp. 其 速度 平均 也 很 快 。 对 于 真正 所 有 合理 的 模型 .业已 证 明 , 若 使 用 按 大 小 求 并 则 连续 M 





次 运算 需要 O 〇 CAD) 平均 时 间 。 这 是 因为 当 随机 的 诸 Union 热 行 时 整个 算法 一 般 只 有 一 些 很 小 
的 集合 ( 通 肖 含 一 个 元 索 ) 与 大 集合 合并 ， 

另外 一 神 实 现 方法 为 按 高 度 求 并 (union-by-height)， 它 同样 保证 所 有 的 树 的 深度 最 多 是 
O(log NJ. 我 们 跟踪 每 棵 树 的 高 度 而 不 是 大 小 并 执行 那些 Union 使 得 浅 的 树 成 为 深 的 树 的 
子 树 。 这 是 一 种 平缓 的 算法 ,因为 只 有 妆 两 棵 相等 深度 的 树 求 并 时 树 的 高 度 才 增加 (此 时 树 
的 高 度 增 1)。 这 样 , 按 高 度 求 并 是 按 大 小 求 并 的 简单 修改 。 

下 列 各 图 显示 一 棵 树 以 及 它 对 于 按 大 小 求 并 和 按 高 度 求 并 的 非 显 式 表 和 示 。 图 8-13 中 的 
程序 实现 的 是 按 高 度 求 并 的 代 三 ， 
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/* Assume Rootl and Root? are roots */ 
/* union is a C keyword, so this routine */ 
/* is named SetUnion */ 


void 
SetUniont DisjSet $, SetType Rootl, SetType Root2 ) 
{ 


if€ SE Rootz ] < SE Rootl 1 ] /* Raot2 is deeper set “y 
; SF Rootl ] = Root?2; /* Make Root? new root */ 
i else 


ift SE Root] ] == SE Root2 ] ) /* Same height, ui i 
5[ Rootl J--; /* 50 update */ | 


S[ Root? ] = Rootl; 
' | 





图 8-13 按 高 度 ( 秩 ) 求 并 的 程序 


8.5 路 径 压 缩 


ves Ay BHÉXEBS Union/Find 算法 对 于 大 多 数 的 情形 都 是 完全 可 接受 的 ， 它 是 非常 简单 的 ， 
而 日 对 于 连续 M 个 指令 (在 所 有 的 模型 下 ) 平 均 是 线性 的 。 不过, OCM log N) 的 最 坏 情况 还 
是 可 能 相当 容易 并 自然 地 发 生 的 。 例 如 ， 如 果 我 们 把 所 有 的 集合 放 到 一 个 队列 中 并 重复 地 证 
前 两 个 集合 出 队 而 让 它们 的 并 入 队 ， 那么 最 坏 的 情况 就 会 发 生 。 WEB Find 比 Union # 
Ws. 都 么 其 送行 时 间 就 比 快速 查找 算法 的 运行 时 间 要 粳 ， 而 用 应 该 清楚 ,对 于 Union 算法 
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tegi Be EY] RE. RE PIE; 执行 Union 操作 的 任何 算法 都 将 产生 相同 
的 最 坏 情 形 的 树 ,， 因 为 它 必 然 会 随意 打破 树 阅 的 均衡 。 因 此 ， 无 须 对 整个 烽 搞 结 梅 重 新 加 荆 
而 使 算法 如 速 的 惟一 方法 是 对 Find 操作 做 些 更 聪明 的 工作 。 

这 种 聪明 的 操作 间 做 路 径 压 缩 (path compression)。 路 径 压 缩 在 一 次 Find 操作 期 间 执 行 
而 与 用 来 执行 Union 的 方法 无 关 。 设 操作 为 Find( X), 此 时 路 径 压 缩 的 效果 是 ， 从 X SA 
路 径 上 的 每 一 个 节点 部 使 它 的 父 节点 变 成 根 。 图 8-14 指出 在 对 图 8-12 的 最 坏 的 树 执行 Find 
CLS) Ja ESSE TE CR. 





图 8-14 PETSPEBABS— TP 


He 45 Ag a Sc ET GE FS) A138 和 14 现在 离 根 近 了 一 个 位 鉴 ， 
而 节点 15 和 16 现在 离 根 近 了 两 个 位 置 。 因 此 ,对 这 些 节 点 末 来 的 快速 存 取 将 付出 (我 们 项 
望 } 额 外 的 工作 来 进行 路 径 压 缩 。 | 

主 如 图 8-15 中 的 程序 所 指出 的 , BEERTA EA Find 操作 收 变 不 大 。 对 Find 例 程 来 
涝 ,惟一 的 恋 化 是 使 得 SLX] 等 于 由 Find 返回 的 值 ; RH, 在 集合 的 根 被 递归 地 找到 以 厂 ， 
X 就 十 接 指 向 它 。 对 通 向 根 的 路 径 上 的 每 一 个 节点 这 将 递归 地 出 现 ,因此 实现 了 路 征 上 小 次 。 





SetType 
Find( ElementType X, DisiSet 3 jJ 


if( 5[ X 1] <= 0 2 
return X; 
else 
return SE X 1 = Find( SL X 1, 5); 


图 8-15 用 路 径 乓 缩 进行 不 相交 集 Find 的 程序 


当 任 意 执行 一 些 Union 操作 的 时 候 , 路 径 压 英 是 一 个 好 的 想法 ， 因 为 存在 许多 的 深层 六 
点 并 通过 路 径 压 缩 将 它们 移 近 根 节 点 。 业 已 证 明 , 当 在 这 种 情况 下 进行 路 和 从 压缩 时 ,连续 M 
次 操作 最 多 需要 OCM log N) 的 时 间 。 不 过 , 在 这 种 情形 下 确定 平均 情况 的 性 能 如 何 仍 然 大 
一 个 尚 本 解决 的 问题 。 

路 径 压 缩 与 按 大 小 求 并 完全 兼容 , 这 就 使 得 两 个 例 程 可 以 同时 实现 。 由 于 单独 进行 按 六 
小 求 并 要 以 线性 时 间 执行 连续 M 次 运算 ， 因此 还 不 清楚 在 路 径 压 缩 中 涉及 的 额外 一 赵 工 作 
平均 来 讲 是 否 值得 。 这 个 问题 实际 上 仍然 没有 解决 。 不 过 后 面 我 们 将 会 看 到 , MEEN SER 
巧 求 并 法 则 结合 在 所 有 情况 下 都 将 产生 非常 有 效 的 算法 。 

路 径 讨 缩 不 完全 与 按 高 度 求 并 兼容 , 因为 路 径 压 缩 可 以 改变 树 的 高 度 。 我 们 根本 不 清楚 
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如 何 有 效 地 去 重新 计算 它们 .答案 在 不 去 计算 11 ms oF em B rame REX ETT S 
高 度 ( 有 时 称 为 秩 一 一 rank), 但 实际 上 按 秩 求 并 ( 它 和 正 是 现在 已 经 变 成 的 这 样 ) 理 论 上 和 按 大 
小 求 并 效率 是 一 样 的 。 不 仪 如 此 , 高 度 的 更 新 也 不 如 大 小 的 由 新 同 繁 。 与 按 太 小 求 并 一 样 ， 
我 们 也 涉 清 楚 路 径 于 缩 平 均 说 来 是 否 值 得 ”下 一 节 将 让 明 , 使 用 求 并 试探 法 或 路 径 蛙 绒 都 能 
够 显 蔓 地 减少 最 坏 情 况 运 行 时 间 。 


8.6 按 秩 求 并 各 路径 压缩 的 最 坏 情 形 


当 使 用 两 种 探测 法 时 ,算法 在 最 坏 情形 下 几乎 足 线 性 的 。 特 别 地 ,在 最 坏 情形 下 需 归 的 
IAE (Na CM，N)) (假设 MƏN), É, a(M, N) Ackermann PAX, Acker- 
mann RRA PAE 

Al, 9) = 2,1 
ALi, 1) Ati — 1,2), 722 
AQ,j) = ACi- 1, Ali, j - D), i, fee 





d 


由 此 我 们 定义 
aCM, N) = minlizi| AG, LM/N]) > log Ni 

你 可 以 想 要 计算 某 些 值 ， 不 过 实用 中 af ，N) 拓 4, XOT AE RLIE RE ERU, BES 
Ri Ackermann MAM SM le N. EARN 的 直到 NN 去 1 ta} Bp AY A, TE. 
log" 65536 = 4, 这 是 因为 log log log log 65536 = 1. Log* 2°95 25, 不 这 要 知道 , 2° en] ze 
一 个 有 20 000 位 数字 的 大 数 ，a (OM. NO SEES RSE log^ N 增长 得 还 慢 。 然 而 ，a( M， 
N) 却 不 是 常数 , 因此 运行 时 间 并 不 是 线性 的 。 

在 本 节 的 其 余部 分 我 们 将 证 明 一 个 稍微 弱 一 些 的 结果 。 我 们 将 证 明 , 任意 顺序 的 M = 
NUNYX Union/Find 操作 花费 总 的 运行 时 间 为 OCM log" N) SIR FARR ADR FEC 
求 并 , 则 这 个 界 同 样 是 成 立 的 。 对 它 的 分 析 大 概 是 本 书 最 为 复杂 的 分 析 工 作 , 也 是 曾 对 事实 
上 实现 了 的 非常 简单 的 一 个 算法 进行 的 第 一 批 真 正 复杂 的 最 坏 情 形 的 分 析 之 一 : 

8.6.1 Union/Find 算法 分 析 

在 这 一 小 节 , 我 们 对 连续 M = (CN) 次 Union/Find 操作 的 运行 时 间 建 立 一 个 相当 产 镶 
的 界 ，Union 和 Find 可 以 以 任何 顺序 出 现 , 但 是 Union BAR PITH TT Find 则 利用 路 答 压 缩 

我 们 通过 建立 某 些 涉 及 秩 + 的 节点 个 数 的 引 理 开 始 。 直 观 地 看 ， 由 于 按 秩 求 并 的 法 则 ， 
小 秩 的 节点 要 比 大 秩 的 节点 多 得 多 。 特 别 是 , 最 多 可 能 存在 一 个 秩 为 log N 的 节点 。 我 们 想 
此 得 出 对 任意 给 定 秩 r 的 节点 个 数 的 一 个 尽 可 能 精确 的 界 。 由 于 秩 仅 当 Union Buts CO mi 
"MERE EC HELD OR SE, ARNT LGB Ba A Ps ROI IE PH OCT e 

引 理 8. 1 

当 执行 二 系列 Union 指令 时 , 一 个 秩 为 7 的 节点 必然 至 少 有 27 个 后 裔 (包括 它 自 己 ) 

证 阴 : 

数学 归纳 法 。 对 于 基准 情形 r= 0 引 理 显然 成 立 。 令 了 BRA a BOA fe fe MAN] 
Mt HO X ET 的 根 。 设 涉及 X 的 最 后 一 次 Union 是 在 T, 和 T; ATA. WT, 的 根 





— — ^ 


C) Ackermann 函数 常常 用 AC, 0 7; * 1m REX 书 中 的 形式 增长 得 更 块 ; 因此 , 它 的 递增 长 得 就 更 慢 。 
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AX, WET, 的 秩 是 r, 那么 T, 就 是 -- 标 高 度 为 r WY AR, 这 与 TE 
Ai i> BROW Ra. Bk TD, BRUIT SERT r-i, To MRD FET Ti 的 秩 。 
由 于 TER: 而 秩 只 能 因 T 增加 , 因此 T. RA r- ls TE T 的 秩 为 — 1。 根据 归 
AB, BRON mU 27 ! 个 后 高 , 从 而 总 数 为 2” Pe, 引 理 得 证 ， 

引 理 8.1 告诉 我 们 ， 如 果 不 进行 路 往 压 缩 ， 那么 秩 为 > 的 任意 节点 必然 至 少 有 2 个 后 
Am. 当然 , 路 径 压缩 可 以 改变 这 种 状况 , 内 为 它 能 够 把 后 商 从 节点 上 除去 。 Bal. MIE 
Union, E S HEUS FERE, 我 们 都 是 在 使 用 秩 ,， 这些 秩 是 高 庆 的 估计 值 。 这 些 秩 的 行为 就 
像 是 没有 路 冬 压 缩 一 样 。 困 此 ， 当 确定 秩 为 r 的 节点 个 数 的 界 时 ,路径 压 第 可 以 忽略 . 

于 是 , 下 面 的 定理 对 于 有 路 径 压 缩 还 是 疫 有 路 径 压 缩 都 旦 成 立 的 。 

引 理 8.2 

秩 为 + 的 半点 的 个 数 最 多 是 N/2'， 

ut BH 

HERBER. 每 个 秩 为 e 的 节点 都 是 至 少 有 27 个 节点 的 子 树 的 根 。 在 该 子 树 中 没有 
其 秩 能 够 是 的 节点 。 因 此 , 秩 为 7 的 那些 节点 的 所 有 的 子 树 是 不 相交 的 。 于 是 ,存在 至 多 
NZ27 个 不 相交 的 子 树 ， 从 而 最 多 有 N/V 个 秩 为 r 的 节点 。 

下 一 个 引 理 看 似 多 少 有 些 显 而 易 见 , 不 过 它 在 我 们 的 分 析 中 却 是 至 大 重要 的 ， 

引 理 8.3 

在 Union/Find 算法 的 任 一 时 劾 ,从 树叶 到 根 的 路 径 上 的 节点 的 秩 单调 增加 。 

证 阴 

加 果 不 存在 路 径 压 缩 , 那么 该 引 理 显然 成 立 { 参 见 例子 )。 如 果 在 路 径 压 缩 后 某 个 节点 o 是 w 的 
— ANG, 那么 当 只 考虑 Union 时 显然 v 必然 已 经 是 w 的 一 个 后 商 了 。 因 此 。Y REF w 的 秩 

让 我 们 来 总 结 这 些 初步 的 结果 。 引 理 8.2 告诉 我 们 多 少 节点 可 以 赋予 铁 x*。 央 为 秩 只 有 


[274 通过 Union 赋值 , 所 以 引 理 8.2 在 Union/Find 算法 的 任何 阶段 甚至 在 路 径 压 缩 的 中 癌 痢 古 


成 立 的 。 图 8-16 指出 ， 当 存在 许多 秩 为 0 和 1 的 节点 时 , 随 着 > 的 增 大 秩 为 > PR 

s| 理 8.2 在 对 任意 秩 r 都 有 可 能 存在 NO 个 节点 的 定义 下 是 严格 的 。 但 该 引 理 还 是 稍微 
有 些 宽松 ,因为 不 可 能 对 所 有 的 秩 > 这 个 界 同 时 成 立 。 引 理 8.2 描述 了 秩 为 了 的 节点 的 个 数 ， 
而 引 理 8 .3 则 告诉 我 们 它们 的 分 布 。 正 如 所 期 望 的 , 节点 的 秩 沿 着 从 叶 到 根 的 路 径 严格 递增 。 

现在 我 们 准备 证 明 主要 的 定理 。 证 明 的 基本 想法 如 下 : 对 任何 节点 v 的 Find 所 花费 的 
时 间 与 从 vo 到 根 的 路 径 上 的 节点 的 个 数 成 止 比 。 现 在 证 我 们 对 每 个 Find 在 从 o BUR AS ERE 
的 每 一 个 节点 收取 一 个 单位 的 费用 。 为 了 帮助 我 们 计算 这 些 费 用 . 我 们 想像 在 路 径 的 每 一 
个 节点 上 存 人 一 美 分 。 严 格 地 说 这 是 一 个 会 计 诀 窃 ， 它 并 不 是 程序 的 一 部 分 。 当 算法 结束 
时 ,我 们 将 已 经 存 人 的 所 有 分 币 合 起 来 , 这 就 是 总 的 花费 。 

作为 进一步 的 会 计 诀窍 , 我 们 存 人 美 分 和 加 拿 大 分 两 种 分 币 。 我 们 将 让 明 , 在 算法 执行 
期 间 , 对 于 每 次 Find 我 们 只 能 存 人 一 定量 的 美 分 。 我 们 还 将 证 明 , 我 们 只 能 存 人 一 定量 的 加 
拿 大 分 到 每 一 个 节点 上 。 把 这 两 笔 总 数 加 起 来 就 得 到 能 够 存 人 的 分 币 的 总 数 的 界 ， 

现在 稍微 详细 地 概述 我 们 的 计算 方案 。 我 们 将 按照 秩 来 划分 节点 。 把 秩 分 成 一 些 秩 组 - 
对 每 个 Find, 我 们 将 把 一 些 美 分 币 存 成 共同 的 储 金 , 而 把 加 拿 大 分 币 存 到 一 些 特定 的 项 所 
|. 为 了 计算 所 存储 的 加 拿 大 分 币 的 总 数 . 我 们 将 计算 每 个 节点 上 的 储量 。 递 过 将 秽 + 的 每 
个 节点 的 储 使 如 起 来 ,我们 得 到 每 个 秩 r 的 总 的 储量 。 然 后 ,我 们 青 把 秋 组 g PENR 
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的 所 在 坟 量 加 起 来 从 而 得 到 每 个 秩 组 g We. fun. 我 们 把 每 个 秩 组 g 的 所 有 储 金 加 


到 一 起 就 得 龟 在 森林 中 存储 的 如 拿 大 分 币 的 总 数 。 把 这 笔 峙 金 即 到 作为 具 同 储 金 的 美 分 币 的 
数目 上 则 得 到 最 后 的 答案 





图 8-16 “…- 棵 大 的 不 相交 集 树 ( 节 点 下 面 的 数 是 秩 ) 


我 们 将 把 秩 划 分 成 组。 秩 + 被 分 到 组 G(x), 而 G 将 在 后 面 确 定 。 任 何 秩 组 g 中 最 大 的 
BOB Fig). 其 中 下 = G 'E GAY., Fe, 在 任何 秩 组 g > OP RN TDR P(g) > 
Fg - 1) ,显然 ，G(N) 是 最 大 秩 纪 的 一 个 非常 宽松 的 上 界 。 作 为 一 个 例子 , 假设 我 们 按照 
图 8-17 将 秩 分 组 。 在 这 种 情况 下 ， G(r) =[Yr1。 在 组 g 中 的 最 大 的 秩 足 Ftg) = gri 并 
观察 到 组 p > OMAK Fg — 1) + 1 直到 Flg)。 这 个 公式 不 适用 秩 组 0, 因此 为 了 方便 ， 
我 们 将 保证 秩 组 0 只 包含 秩 为 和 的 元 素 。 注 意 ,， 这 些 秩 组 是 由 一 些 连 续 的 秩 构 成 的 。 

我 们 以 前 提 到 过 ， 只 要 每 个 根 记 录 着 它 的 于 树 都 是 多 大 , 则 
每 个 Union 指令 仅 花 费 常 数 时 间 。 因 此 ， 就 本 证 明 而 言 ，Union 
实际 下 是 不 花费 代价 的 。 








2,1,4 






每 个 Find(7) 花 费 的 时 间 正 比 于 从 代表 ;的 项 点 到 根 的 路 径 ; rough A 
上 的 顶点 的 个 数 。 因 此 , RATER -AMRA T | j= 18 + 1 through r’ 


分 币 。 不 过 , 如 果 这 就 是 我 们 所 做 的 全 部 , 那么 我 们 不 能 对 界 有 
更 多 的 要 求 , 因为 没有 利 几 到 路 径 计 缩 。 因 此 , 我 们 需要 在 分 析 mam 
中 利用 路 从 压缩 。 我 们 将 使 用 想像 算账 (faney aceounting) 的 方法 。 可能 的 划分 

对 内 代表 i 的 顶点 到 根 的 路 径 上 的 每 一 个 顶点 ,我 们 在 两 个 账户 之 一 存 人 一 个 分 币 : 

1 WE o EH, 或 者 o 的 父亲 是 根 , 或 者 的 父亲 在 与 6 不 同 的 秩 组 中 ,那么 在 该 法 则 

之 下 收取 一 个 单位 的 费用 , 这 就 需要 将 一 个 美 分 币 存 人 公共 储 金 中 。 

2. 否则 , 将 一 个 加 拿 大 分 币 存 人 该 贷 点 中 。 

引 理 8.4 

对 于 任意 的 Find(w), 不 论 存 人 总 储 金 还 是 存 人 顶点 , 所 存 分 币 的 总 数 恰好 等 于 从 到 
棚 的 路 径 土 的 节点 的 个 数 。 

证 明 

显然 。 

如 此 一 来 , 我 们 需要 做 的 就 是 把 在 法 则 1 下 在 人 的 所 有 的 美 分 币 利 在 法 则 2 下 存 人 的 所 


有 加 拿 大 分 币 吉 起 来 。 
我 们 进行 最 多 M 次 Find。 我 们 需要 求 出 在 一 次 Find 中 能 够 存 人 公共 储 金 中 的 分 币 个 数 的 界 。 


— 


76, 


to 
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引 理 8.5 
east Re PAE, 在 法 则 1 下 美 分 币 总 的 存 人 量 总 计 为 M(GON) 1 2). 
WE RH 
证 明 木 难 。 半 于 任意 的 Find, 由 于 有 根 和 它 的 儿子 , AAR TED. 由 引 埋 8.3， 
沿路 径 向 上 上 分布 的 节点 按 科 单调 增 ， 而 由 于 最 多 有 GON) DRA, 因此 对 任意 特定 的 Find, 
在 路 径 上 只 有 GCN) 个 其 他 节点 能 够 按照 法 则 1 存 人 分 币 。 于 是 , 在 任意 一 次 查找 期 间 最 多 
有 GUN) + 2 个 美 分 币 可 以 放 入 公共 赃 金 中 因此, 在 法 则 1 B. 连续 M 次 Find 最 多 可 以 
FA M(GCN)+2) 个 美 分 币 。 
为 了 得 到 在 法 则 2 下 所 有 加 拿 大 分 币 丰 入 量 的 理想 的 知 计 值 , 我 们 将 把 按照 项 点 而 不 是 按照 
Find 指令 所 存 入 的 分 币 量 如 起 来 如果 一 梳 人 硬币 在 法 则 2 下 存 人 顶点 v, 那么 o ETRE 
被 移动 并 得 到 具有 上 比 它 原来 的 父 节 点 更 高 的 秩 的 新 的 父亲 。( 在 这 里 , 我 们 用 到 了 正在 进行 路 挫 压 
缩 的 事实 ) 于 是 , 秩 组 g > 0 中 的 节点 v 在 它 的 父 节点 被 推 离 秩 组 g 之 前 最 多 可 以 移动 Flg) - 
F(g — DY, 因为 这 是 该 秩 组 的 大 小 :在 这 以 后 , 对 o 的 所 有 未 来 的 收费 均 按 照 法 则 1 进行 。 
引 理 8.6 
PA g > 0 中 顶点 的 个 数 V(g) 至 多 为 NAs D, 











证 明 
由 引 理 8. 2, 至 多 存在 N27 个 秩 为 > 的 顶点 。 对 组 g 中 的 秩 求 和 , 我 们 得 到 
Fig) 
Vig) x jj N 
r=Fig-1}+1 2 
SON 
-= FÜg-1)1 2" 
c I] 
mL 一 
tl 2 
N oo 
S aF(g-1)*1 2; x 
2N 
< 2FGg-U0 +l 
EM FOD 
51 8.7 
TARA g 的 所 有 顶点 的 加 拿 大 分 币 的 最 大 个 数 至 多 是 NF (gyae 9, 
证 明 


该 秩 组 的 每 一 个 顶点 当 它 的 父 节 点 同 在 该 秩 组 时 最 多 可 以 接收 Fg) — Fle - DS 
EGO 个 加 拿 大 分 币 , 而 引 理 8.6 告诉 我 们 这 样 的 项 点 存在 的 个 数 。 通 过 简单 的 乘法 可 以 得 
到 定理 的 结果 。 

引 理 8.8 

在 法 则 2 下 总 的 存 人 分 币 数 最 多 为 ND O, FG) 287? 个 加 拿 大 分 币 。 

uk RH 

因为 秩 组 0 只 含有 秩 为 0 的 元 素 ,所 以 它 不 能 按照 法 则 2 接收 分 币 ( 这 样 的 元 素 在 该 牧 


O BOM TT ELM 1。 不 过 , PETAR Fe; 此 处 的 界 不 是 经 过 仔细 改进 的 界 。 


* dux ADT 21 
SA AS E4070). EXE OR OR PU n] FB S| EE HB BAT. 

QUEE, FETS sU: AA) 2 FAM SR, 该 总 数 为 

tri) 
MOGUN) +2) + NNO Fg) APU (8.1) 

我 们 还 没有 指定 GONE ERM FON), BR, EREKE [9f] VA BS BE PESE TALE YE 
Mee, 但 是 它 应 使 得 选择 GUN) 极 小 化 上 面 的 界 有 意义 ,不 过 , AR GONO Koh. gil 
FON RISK, 这 就 影响 到 我 们 的 界 ， 一 个 明显 的 理想 选择 是 选取 FF( 门 为 由 下 (0) = 0 Al 
For) = 276 - OAE x ls, FRG GON) = 1 Fiog Njo B 8-18 mons f HT 
何 由 此 而 划分 的 。 注 意 , 组 0 ASH, 这 是 我 们 在 前 面 引 理 中 更 求 的 . 下 非常 类 似 于 单 
值 Ackermann PAX, 它们 只 在 基准 情形 的 定 羡 上 有 所 不 同 (F(0) = 1). 

定理 8.1 





组 
M 次 Union 和 Find 的 运行 时 间 为 OCM log? N)。 . | 
证 明 ; | 
2 | 
把 下 和 G 的 定义 插入 到 方程 8.1 中 , 美 分 币 的 总 数 为 OMG | 10 UM | 
(N)) = OUM kg? N), 加拿大 分 币 的 总 数 为 N TT F2 | ga 


53537 throogh 255» | 
truly huge ranks | 


= NASTI = NGON) = O(N leg" N) > hTM = Q(N), 因此 
得 出 定理 的 界 。 图 8-18 在 让 明 中 诈 到 的 

我 们 的 分 析 指 出 ,能够 通过 路 径 庄 缩 经 常 移动 的 闻 点 很 少 ， ”将 秩 分 成 秩 组 的 实际 划分 
从 而 总 的 时 间 花 费 相对 要 少 。 


8.7 一 个 应 用 


作为 怎样 可 以 使 用 该 数据 结构 的 一 个 例子 , 考虑 下 面 的 问题 。 我 们 有 一 个 计算 贫 网 纵 和 
-个 双向 连接 表 ; 每 一 个 连接 可 将 文件 从 一 台 计 算 机 传送 到 另 一 台 计 算 机 。 那 么 ， 能 否 将 一 
个 文件 从 网 络 上 的 任意 一 台 计 算 机 发 送 到 任意 的 另 一 台 计 算 机 上 去 呢 ? 一 个 附加 的 限制 是 妥 
求 该 问题 必须 联机 (on-line) 解 决 。 因 此 ， 这 个 连接 表 要 一 次 一 个 地 给 出 ， 而 算法 则 必须 能 够 
在 任 一 时 刻 给 出 答案 。 

解决 这 个 问题 的 一 个 算法 可 以 在 开始 时 把 每 一 台 计 算 机 放 到 它 让 己 的 集合 中 、 我 们 竖 求 
师 台 计算 机 可 以 传输 文件 当 且 仅 当 它 们 在 同一 个 集合 中 。 可 以 看 出 , 传输 文件 的 能 力 形 成 一 
个 等 价 关系 。 此 时 我 们 一 次 一 个 地 读 人 连接 。 当 我 们 读 人 某 个 连接 比如 (x ， 0) 时, 我 们 测试 
Rz u 和 在 同一 个 集合 中 , 如 果 它 们 在 间 一 个 集合 中 则 什么 也 不 敌 。 如 果 它 们 在 不 同 的 集 
全 中， 那么 我 们 将 它们 所 在 的 上 两 个 集合 合并 。 在 算法 的 最 后 , 所 得 到 的 图 连通 当 划 仅 当 恰好 
存在 -一个 集合 。 如 果 存 在 M 个 连接 和 和 台 计 算 机 , 那么 空间 的 需求 则 是 O(N)。 使 用 按 大 
小 求 并 和 路 径 压 缩 的 方法 , 我 们 得 到 最 坏 情 形 运行 时 间 为 O(M a (M, ND), 因为 存在 2M 
次 Find 和 至 多 N - 1 次 Union。 这 个 运行 时 间 在 实用 中 是 线性 的 。 

在 下 一 章 我 们 将 会 看 到 一 个 好 得 多 的 应 用 。 


BA 
我 们 已 经 看 到 保持 不 相交 集合 的 非常 简单 的 数据 结构 。 当 Union 操作 执行 时 , 就 止 确 性 
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Mi, RARA EHETE, RH, AMBER, SAO M KU EO 
PME, eee A Sl AB IE EA, Union BRIM; 借助 这 一 点 , 我 们 能 够 得 到 一 个 
有 效 得 多 的 算法 ， 
(278! BAAS He SE X A IA SK (sclf-adjustment) Bc RE SC 0 — . RITA RAS E 7 CE, 
lozo] 斜 推 ) 见 到 过 。 它 的 使 用 非常 有 趣 , 特别 是 从 理论 的 观点 来 看 ,因为 它 是 算法 简单 但 最 坏 悄 
形 分 析 却 并 不 这 么 简单 的 第 一 批 例子 之 一 - 


练习 


8.1 指出 下 列 一 系列 指令 的 结果 : Union(1, 2), Union(3, 4), Union(3, 5), Union(1, 
7), Union(3, 6), Union(8, 9), Union(1, 8), Union(3, 10), Union(3, t1), U- 
nion 3, 12), Union(3, 13), Union(14. 15), Union(16, 17), Union( 14, 162. U- 
nion(1, 3), Union(1, 14), “4 Union 是 
a. 任意 进行 的 。 

b. 按 高 度 进行 的 ， 
c. 按 大 小 进行 的 。 

8.2 ”对 于 上 题 中 的 每 一 棵 树 ， 用 对 最 部 节 点 的 路 径 上 庄 短 执行 一 次 Finde 

8.3 编写 -个 程序 来 确定 路 径 压缩 法 和 各 种 求 并 方法 的 效果 。 你 的 程序 应 该 使 用 所 有 
六 种 可 能 的 方法 处 理 一 系列 等 价 操 作 。 

8 4 WEBB, 如果 Union 按照 高 度 进行 , 那么 任意 - 棵 树 的 深度 则 为 O(log N)- 

8.5 a. 证 明 如 果 M = N°, 那么 M 次 Union/Find 操作 的 运行 时 间 是 OCM). 

b. 证明, WE M = N log N, 那么 M 次 Union/Find 操作 的 运行 时 间 是 OM }o 
«c. i$ M =@ (N log log N), Sl M 次 Union/Find 操作 的 运行 时 间 是 多 少 ? 
«d. HEM = O(N log’ N), W M 次 Union/Find 操作 的 运行 时 间 是 多 少 ? 

8.6 指出 8.7 节 中 的 程序 对 下 图 的 操作 : (1, 2), (3, 4), (3, 6), (5, 7), (4, 6), Q2, 
4), (8, 9), (5, 8). 连通 分 支 都 是 什么 ? 

8.7 ”编写 一 个 程序 实现 8.7 节 的 算法 - 

,8 8 ”假设 我 们 可 要 添加 一 个 附加 的 操作 Deunion, 它 废除 尚 林 被 废除 的 最 后 的 Union & 
f£. 
a 证明: 如 果 我 们 按 高 度 求 并 以 及 不 用 路 径 压 缩 进行 Find, 那么 Deunion 操作 容 
易 进 行 并 且 连 续 M 3X Union, Find 和 Deunion 操作 花费 OCM log NOE]; 
b， 为 什么 路 径 压 缩 使 得 Deunion 很 难 进 行 ? 
xc. 指出 如 何 实现 所 有 三 种 操作 使 得 连续 M 次 操作 花费 OUCM log N “og log N) 时 
问 。 
,8 9 ”假设 我 们 轧 要 洪 加 一 种 额外 的 操作 Remove( X) ,该 操作 把 X 从 当前 的 集合 中 除去 
并 把 它 放 到 它 自己 的 集合 中 。 指 出 如 何 修改 Union/Find 算法 使 得 连续 M 次 
Union. Find. # Remove 操作 的 运行 时 间 为 OLM a( M, N)X 
> #8.10 给 出 一 个 算法 以 一 棵 N MARAN 对 顶点 作为 输入 , HARTIA w, wE v 
Al w 的 最 近 的 公共 祖先 。 你 的 算法 应 该 以 OCN log" NN) 时 间 运 行 。 
«8.11 证 明 , 如 果 所 有 的 Union 都 在 Find 之 前 ， 那么 使 用 路 径 压 缩 的 不 相交 集 算 法 需要 
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线性 时 间 , 即使 Union 是 任意 进行 的 也 是 如 此 。 
: «8.12. 证 明 , WRR Union 操作 任意 进行 , 但 路 径 压 缩 是 对 Find 进行 , 那么 最 坏 情 形 运 
{FHT AO (M log N)。 
8.13 证 明 , 如 果 Union HAD AAA SR (S Ho. 那么 最 坏 情形 运行 时 间 为 OCM 
log " N) 5 
8.14 设 我 们 通过 使 在 从 i 到 根 的 路 径 上 的 每 一 个 其 他 节点 指向 它 的 祖父 ( 当 有 意义 时 ) 
以 实现 对 Find( 7) B5 4434-42 E Si (partial path compression), XX HY [838 £8 -F > ( path 
halving) 。 
a， 编 写 一 个 过 程 完 成 上 述 工作 . 
b. 证 明 , 如 果 对 诸 Find 操作 进行 路 径 平分 , 则 不 论 使 用 按 高 度 求 并 还 是 按 大 小 求 
JF. Hai tat eA OCM log" ND. 
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第 9 章 图 论 算 法 


在 这 -一 童 , 我 们 讨论 图 论 中 几 个 一 般 的 问题 , 这 些 算法 不 仪 在 室 践 中 有 用 , 而且 因为 在 
许多 实际 生活 的 应 用 尝 ， 友 不 仔细 注意 数据 结构 的 选择 将 导致 球 度 过 慢 ， 所 以 这 些 算法 还 是 
SE ay Ft BRAT, 我 们 将 

* 介绍 几 个 现实 生活 中 发 生 的 问题 , 它们 可 以 转化 成 图 论 问题 。 

* 给 出 一 些 算法 以 解决 几 个 普通 的 图 论 问 题 ， 

。 指出 适当 选 拌 数据 结构 可 以 极 大 地 降低 这 些 算 法 的 运行 时 间 ， 

。 介绍 一 -个 被 称 为 深度 优先 搜索 (deptb-first search) WBE IS, FIR E ms BE SE LJ 

线性 时 间 求 解 若 干 表 面 上 复杂 的 问题 。 


9.1 若干 定义 


— 8 (graph)G = (V. ERAS (vertex) V 和 边 (edge) 集 下 组 成 ,每 一 条 边 就 是 
— dg Co, ud, EP v, w € Ve AMIR ard. HR Sos IU PES, 那么 图 就 
叫做 是 有 向 的 (direstcd)、 布 商 的 图 有 时 也 叫做 有 向 图 (digraph)。 顶点 v se 34 Cadjacent) 
"OH SUCH. w) € Es -TERIH v, IMMA Abe, vo AAP, w RE o 邻接 
Alc BAe OBE, AERA ES Re PRI (weight ) SR (cost), 

图 中 的 一 条 路 径 {path) 是 一 个 项 点 序列 wey, we, wa. sls WNS ECs, wag) € 
E. 1:5; € N, B ERAS K length) ERMI ba, EFF N — 1. 从 一 个 项 点 到 
它 自 告 可 以 看 成 是 一 条 路 径 ; 如 果 路 径 不 包含 边 , 那么 路 径 的 长 为 0, 这 是 定义 特殊 情形 的 
.一 种 方便 的 方法 。 如 果 图 含有 一 条 从 一 个 硕 点 到 它 自身 的 边 (w， wv), BARE v, v 有 时候 
dnd A 2K oop). 我 们 要 讨论 的 图 -一 般 将 是 元 环 的 , 一 条 贡 单 路 径 是 这 样 一 条 路 径 , 其 上 
的 所 有 顶点 都 是 互 异 的 , 但 第 一 个 顶点 和 最 后 一 个 顶点 可 能 相同 。 

有 向 图 中 的 图 {cycle} 是 满足 wi wy 且 长 至 少 为 1 的 一 条 路 径 ; 如 果 该 路 径 是 简单 路 
£5. 那么 这 个 终 就 是 简单 圈 . 对 于 无 向 图 , 我 们 要 求 边 是 互 异 的 . 这些 要 求 的 根据 在 于 无 
图 中 的 路 径 u,v, u 不 应 该 被 认为 是 圈 , HA Cu, oWo, u) ÆR -RA 但 是 在 有 问 图 
中 它们 是 两 条 不 同 的 边 , 因此 称 它 们 为 项 是 有 意义 的 。 如 果 - “个 有 向 图 没有 图 , 则 称 其 为 无 
图 的 (acyclie), 一 个 有 同 无 图 图 有 时 也 简称 为 DAG. 

如 果 在 一 个 无 疝 图 中 从 每 一 个 顶点 到 每 个 其 他 质点 都 存在 一 条 路 径 ， 则 称 该 无 问 图 起 连 
通 的 {eonneeted)。 具 有 这 样 性 质 的 有 二 匈 称 为 是 强 连通 的 (strongly connected), WE 一 个 有 
向 图 不 是 强 连 通 的 , 但 是 它 的 基础 图 (underlying graph), BUH LEA RI, © 
连通 的 ,那么 该 有 向 图 称 为 是 弱 连 通 的 (weakly connected). 554: (complete graph) 是 其 每 一 
对 项 点 间 都 存在 一 条 过 的 图 ， 

现实 千 活 中 能 够 用 辐 进 行 模拟 的 一 个 例子 是 航空 系统 ，。 每 个 机 场 是 一 个 项 点 , 在 由 两 个 
项 点 表示 的 机 场 间 如 果 存 在 一 条 直达 航线 ， 那么 这 两 个 项 点 就 用 一 条 边 连 接 , 边 可 以 有 一 个 
A, 表示 时 间 、 距离 或 飞行 的 费用 , 有 理由 很 设 ， 这 样 的 一 个 图 是 有 向 图 , 因为 在 不 同 的 方 问 
上 飞行 可 能 所 用 时 间或 所 花 的 费用 会 不 同 ( 例 如 ， 核 赖 于 地 方 税 )。 可 能 我 们 更 愿意 航空 系统 
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是 强 连通 的 , 这 样 就 总 能 够 从 仔 一 机 场 发 到 另外 的 任意 一 个 机 场 -. 我 们 也 可 能 愿意 出 速 确定 
任意 两 个 机 场 之 问 的 最 佳 航 线 。“ 最 侍 " 可 以 是 扒 边 数 最 少 的 路 径 ， 也 可 以 是 根据 一 种 域 所 有 
的 权重 量度 所 算出 的 最 侍者 。 

交通 流 可 以 用 一 个 图 来 模型 化 。 每 一 条 街道 变 叉 站 表示 一 个 项 点， 而 每 一 条 街道 就 是 一 
条 边 . 边 的 值 可 能 代表 速度 限度 , 或 是 穷 量 (车 道 的 数目 ) 等 等 。 此 时 我 们 可 能 需要 找 出 一 条 
最 短路 ,或 用 该 信息 找 出 最 可 能 产生 交通 瓶颈 的 位 置 。 

在 本 章 的 其 余部 分 , 我 们 将 考查 图 论 的 儿 个 更 多 的 应 用 , 这 些 图 中 许多 可 能 是 相当 巨大 
AS. 因此 , 我 们 使 用 的 算法 的 效率 是 非常 重要 的 . 
9.1.1 图 的 表示 

我 们 将 考虑 有 向 图 {无 向 图 可 类 似 表示 )。 

现在 假设 可 以 从 1 开始 对 顶点 编号 。 图 9-1 中 所 示 的 图 含有 7 个 了 顶点 和 12 RA, 





图 9-1 一 个 有 向 图 


表示 图 的 一 种 简单 的 方法 是 使 用 一 个 二 维 数组 , FR Oy 8 HE AE PE (adjacency matrix ) 表示 
法 ,对 于 每 条 边 (4, v), RIE Alue] = 1; 否则 , 数组 的 元 素 就 是 0, 如 果 边 有 一 个 权 ， 
那么 我 们 可 以 置 Alu jv] 等 于 该 权 , 而 使 用 一 个 很 大 惑 首 很 小 的 权 作为 标记 表 不 不 存在 的 
力 ” 栅 如 ,如 果 我 们 寻找 最 便宜 的 航空 路 线 , 那么 我 们 使 用 ce 表示 不 存在 的 航线 。 如 打出 于 
其 种 原因 我 们 寻找 最 帅 贵 的 航空 路 线 ,那么 我 们 可 以 用 值 - oo CLE VE EF ORA As FF 
在 的 边 。 

虽然 这 么 表示 的 优点 是 非常 简单 , 但 是 , 它 的 空间 需求 则 为 eC VI. Au S Pe e x E 
很 多 , 那么 这 种 表示 的 代价 就 太 大 了 。 GABA BH (dense): |E| = GC V|?), MAREE 
是 合适 的 表示 方法 。 不 过 , 在 我 们 将 要 看 到 的 大 部 分 应 用 中 , 情况 并 不 如 此 。 例如 , ZA 
示 一 个 街道 地 图 , 街道 的 方向 呈 曼 哈 顿 式 ， 其 中 几乎 所 有 的 街道 或 者 南北 向 , 或 者 东 廿 向 。 
因此 , 任 一 路 口 大 致 都 有 四 条 街道 , TE, 如 果 图 是 有 向 图 且 所 有 的 街道 都 是 双向 的 , 则 E 
~ 4| TV。 如果 有 3000 个 路 口 , 那么 我 们 就 得 到 一 个 3000 个 项 点 的 图 ， 该 图 有 12000 条 过 
它们 需要 一 个 天 小 为 000 000 的 数组 。 该 数组 的 大 部 分 元 素 将 起 0。 这 从 直观 看 来 很 糖 ,， A 
当 我 们 想 要 我 们 的 数据 结构 表示 那些 实际 存在 的 数据 ， 而 不 是 去 表示 不 存在 的 数据 。 

如 果 图 不 是 稠密 的 , 换 句 话说 , 如 果 图 是 稀疏 的 (sparse) , 则 更 好 的 解决 方法 是 使 用 邻接 
x&(adjacency list) 表 示 。 对 每 一 个 顶点 ， 我 们 使 用 一 个 表 存 放 所 有 邻接 的 项 点 。 此 时 的 空间 再 
KH OUE; + IVi). BE 92 最 左边 的 结构 只 是 涉 单 元 (header cell) 的 数组 ,这 种 表示 力 法 
从 图 9.2 可 以 清楚 地 看 出 。 如 果 边 有 权 , 那么 这 个 附加 的 信息 也 可 以 存储 在 单元 中 。 





疼 9.2 图 的 邻接 表 表 示 法 


邻接 表 是 表示 图 的 标准 方法 。 无 向 图 可 以 类 似 地 表示 ; 每 条 边 (u,v) 出 现在 两 个 表 中 ， 因 
此 空间 的 使 用 基本 上 是 双 信 的。 在 图 论 算法 中 通常 需要 找 出 与 基 个 给 定 项 点 ”邻接 的 所 有 的 项 
点 。 面 这 可 以 通过 简单 地 扫描 相应 的 邻接 表 来 完成 , 所 用 时 间 与 这 些 项 点 的 个 数 成 止 比 。 

在 大 部 分 实际 应 用 中 顶点 都 有 名 字 而 不 是 数字 , 这 些 名 字 在 编译 时 是 术 知 的 。 由 于 我 们 
不 能 通过 未 知名 字 为 一 个 数组 做 索引 . 因此 我 们 必须 提供 从 名 字 到 数字 的 此 射 。 完 成 这 项 工 
作 最 容易 的 方法 是 使 用 散 列表 , 在 该 散 列表 中 我 们 对 每 个 顶点 存储 一 个 名 字 以 及 一 个 范围 在 
1 到 | V | 之 间 的 内 部 编号 。 这些 编 号 在 疼 被 访 入 的 时 候 指 定 。 指定 的 第 一 个 数 是 1. TERR 
被 输入 时 , 我 们 检查 是 否 它 的 黄 个 顶点 都 已 经 指定 了 一 个 数 , 检查 的 方法 是 看 是 骆 顶 点 企 散 
列表 中 。 如 果 在 , 那么 我 们 就 使 用 这 个 内 部 编号 , 否则 , 我们 将 下 一 个 可 用 的 编 与 分 配给 该 
顶点 并 把 该 项 点 的 名 字 和 对 应 的 编号 插入 到 获 列 表 中 。 

经 过 这 样 的 变换 ， 所 有 的 图 论 算法 都 将 只 使 用 内 部 编 续 。 由 于 最 终 我 们 还 是 要 输出 质点 
的 名 字 而 不 是 这 些 内 部 编号 , 因此 对 于 每 一 个 内 部 编号 我 们 必须 记录 相应 的 项 点 名 字 。 一 种 
记录 方法 是 使 用 字符 出 数组 。 如果 顶 点 名 字 长 , 邦 就 要 花费 大 量 的 空间 ,因为 顶点 的 省 宁 要 
存 两 次 。 另 一 种 方法 是 保留 一 个 指向 散 列表 内 的 指针 数组 , 这 种 方法 的 代价 是 稍微 损失 向 列 
表 ADT 的 纯洁 性 ( 散 列 表 的 元 素 就 不 是 通过 基本 的 散 列表 操作 来 访问 了 )。 

本 章 中 的 代码 将 尽 可 能 使 用 ADT HARS. 我 们 这 么 人知 将 节省 空间 ,当然 , 也 使 得 算法 
的 运算 表达 式 更 清晰 。 
9.2 拓扑 排 友 


拓扑 排序 是 对 有 向 无 圈 图 的 顶点 的 一 种 排序 , 它 使 得 如 果 存 在 一 条 从 v, Blu, HE, 
那么 在 排序 中 v; 出 现在 wi 的 后 面 。 在 图 9-3 中 的 图 表示 迈阿密 州立 大 学 的 课程 结构 。 有 辣 边 
(w，z') 表 明 课 程 o 必须 在 课程 ww 选修 前 修 元 、 这 些 课程 的 拓扑 排序 不 会 破坏 课程 结构 要 求 
的 任意 课程 序列 。 

BR, WES A, 那么 拓扑 排序 是 不 可 能 的 ， 因为 对 于 圈 上 的 两 个 顶点 v Hu. v 
先 于 zw iw REF v. 此 外 , 排序 不 必 是 惟一 的 ; 性 何 合理 的 排序 都 是 可 以 的 。 在 图 9-4 
vj. Ug T uj, Urs Us. Var V]. Us» Vh 两 个 都 是 拓扑 排序 。 


中 ， Tys Us. 1s. Tay iai. 
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fj 9-3. Fea Ae AST 


E 9-4 一 个 无 图 图 
MEAM XE RARER PRA AGT. 然后 我 们 显示 出 该 砚 
点 ,并 将 它 和 它 的 边 一 起 从 图 中 删除 。 然后 , 我 们 对 图 的 其 余部 分 应 用 闻 样 的 方法 处 理 。 
M 了 将 上 这 方法 形式 化 我 们 把 顶点 o 的 入 度 {indegree) 定 义 为 边 (w，wv} 的 条 数 , RTI 
计算 图 中 所 有 顶点 的 人 人 度 。 假设 Indegree 数组 被 初始 化 且 图 被 读 人 一 个 邻接 表 中 , 列 此 时 我 
们 可 以 应 用 图 9-5 中 的 算法 生成 -个 拓扑 排序 。 
















võid 
Topsort( Graph G ) 
{ 


tnt Counter; 
Vertex V, Wi 


far( Counter = Q; Counter < NumVertex; Counter++ ) 


V = FindNewVertexOfIndegreeZerot }; 
if ( V -- NotAVertex ) 
{ 

Error( "Graph has a cycle" 3}; 


for each W adjacent to V 


| 
| break 
TopNunl v ] = Counter; 
Indegreei W 1--; 
i ; | 





naru 


图 9.5 简单 的 拓扑 排序 伪 代 码 


函数 FindNew VertexOfindegreeZero Ti Indegree 数组 ， 娃 找 一 个 尚未 被 分 配 折 扑 编 妇 
的 入 度 为 0 的 顶点 。 如 果 这 样 的 顶点 不 存在 , 那么 它 返 回 NotA Vertex; BERANE 

因为 FindNewVertexOfIndegreeZero 是 对 Indegree 数组 的 一 个 简单 的 顺序 扫描 ,所 以 每 
次 对 它 的 调用 都 花费 OC Voti. 由 于 有 | Vi KRPE R MH, 因此 该 算法 的 运行 时 加 为 
OC| VI^). 

SEE AF ah HERE POUR RH LT RT DL ACER EIE. 运行 时 间 长 的 原因 在 于 对 Indegree 2X 
aad. SUR LE, BEA Ac I TUR IR] FB 1 有 一 些 顶点 的 人 度 帘 更 新 。 然 而 ， 
时 然 只 有 一 小 部 分 发 后 变化 , 但 在 搜索 人 度 为 0 的 顶点 时 我 们 (潜在 地 ) 但 看 了 所 有 的 顶点 : 








我 们 可 以 通过 将 所 有 (未 分 配 拓 扑 编 号 ) 人 度 为 入 的 项 点 放 在 一 个 等 殊 的 合子 中 而 避免 这 
AP ACAI SF oh. JAY FindNewVertexOfIndegreeZero 图 数 返 回 ( 并 删除 ) 念 子 中 的 任 一 项 点 . 当 
我 们 降低 这 些 邻 接 顶 点 的 人 度 时 , 检查 每 一 个 顶点 并 在 它 的 入 度 降 为 0 时 把 它 放 人 盒子 中 ， 

为 实现 这 个 盒子 , 我 们 可 以 使 用 一 个 眉 EBA AVES) ABE 








或 队列 . 首先, 34 8E— ARRENAR- 
然后 , 将 所 有 人 人 度 为 0 的 顶点 放 人 一 个 初始 


为 空 的 队列 中 : 当 队 列 不 空 时 , 删除 一 个 顶 
Bou. PRA v 邻接 的 所 有 鸣 顶 点 的 人 度 减 


4， 有 要 一 个 项 点 的 人 更 降 为 0,， 就 把 该 质心 | bi 
放 入 队列 中 此 时 , FUSER RES BA ; um 


e NER e Ed 0-6 显示 每 一 阶段 之 后 的 状态 。 | i BA Ut Ul I" Us a Mr | 


iT EI SC fep 9-7 中 给 j 
出 “和 前 面 一 样 , 我 们 将 假设 图 已 经 被 读 到 图 9.6 对 图 9-4 中 的 图 应 用 拓扑 排序 的 结果 
一 个 邻接 表 中 且 入 度 已 计算 并 被 放 入 一 个 数组 内 。 在 实践 中 做 这 件 工作 的 方便 方法 通常 是 把 每 
一 个 顶点 的 入 度 放 入 头 单元 中 。 我 们 还 假设 有 一 个 数组 TopNum , 该 数组 存放 的 是 拓扑 编号 。 
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| void 
Topsort( Graph G 3; 
i 
Queue Ü; 


int Counter - 0; 
Vertex V, W; 


y* 1*/ Q = CreateQueue( NumVertex }: MakeEmpty(i O 2: 
A of for each vertex V 
/* o 3*/ ifi Indegree[ V ] == 0 5 
/8 4/ Enqueue( V, QJ; 
f* 5*/ while( !IsEnpty( Q 3 ) 
{ 
/* 6&*/ Y = Degueue( Q ); 
fe Fes TopNum[ V J = «Counter;  /*Assign next number */ 
/* B*/ for each w adjacent to V 
A p*/ ifc --indegree[ W ] == 0) 
/*l0*/ Enqueue( W, Q ); 
} 
/*11*/ if ( Counter != NumVertex j 
/*i12*/ Error( "Graph has a cycle" 5; 
/Á*13*/ DisposeQueue( Q ); /* Free the memory */ 





图 中? Hei TIR hE MALTA 
站 果 使 用 邻接 表 , 那么 执行 这 个 算法 所 用 的 时 间 为 OCEL + | V1). 当 认 识 到 for 循环 
体 对 每 条 边 项 多 执行 一 次 时 , 这 个 结果 是 明显 的 。 队列 操作 对 每 个 顶点 最 多 进行 一 次 , 南 蕊 
始 化 各 步 花费 的 时 间 也 和 图 的 大 小 成 正比 。 
903 最 短路 径 算法 
六 _ 节 我 们 考 误 各 种 最 短路 径 问 题 。 输入 是 -个 赋 权 图 : GERA v RRE 


SE EE TALL UT CEPR EDO c; j^ 一 条 路 径 Uy Ua UN ES [EL IE SS 了 Cole Ut] ft BK AR FB E 
(weighted path length). Mi 4423842 K (unweighted path length) HÆRE LANAZ, BIN 一 t 

单 源 最 短路 径 问 题 : 

给 定 一 个 赋 权 图 扣 = (V. EMII— T EE Did s 作为 输入 , 找 出 从 s 到 G 中 每 一 个 其 他 
项 点 的 最 短 赋 权 路 径 。 

例如 ,在 图 9-8 的 图 中 , 从 oo, 到 os 的 最 短 赋 权 路 径 的 值 为 6, EEA vi Bl va I o; E 
到 vs 的 路 径 。 在 这 两 个 顶点 间 的 最 短 雹 权 路 径 长 为 2. 一 般 说 来 ， 当 不 指明 我 们 讨论 的 是 赋 
权 路 径 还 是 无 权 路 径 时 ， 如 果 图 是 赋 权 的 , ARERR. 还 要 注意 ,在 图 9-8 的 图 
Ji, 从 Us 到 UI 没有 路 径 。 

前 面 例 子 中 的 图 没有 负 值 的 边 , 图 9-9 中 的 图 指出 负 边 的 问题 可 能 产生 ， 从 vws 到 o4 的 
路 径 的 值 为 1, 但是, 通过 下 面 的 循环 vs, va. v2, vs, va 存在 -条 最 短路 径 , 它 的 值 是 -3S- 
这 条 路 径 仍然 不 是 最 短 的 ,因为 我 们 可 以 在 循环 中 灌 留 任意 长 。 因 此 , 在 这 两 个 项 点 间 的 最 
短路 径 问 题 是 不 确定 的 。 类 似 地 , 从 oo, os 的 最 短路 径 也 是 不 确定 的 , 因为 我 们 可 以 进入 
十 样 的 循环 。 这 个 循环 叫做 负 值 圈 {negative-cost cycle); 当 它 出 现在 图 中 时 ,最短 路径 问题 惑 
是 不 确定 的 。 有 和 负 值 的 边 未 必 就 是 坏事 , 但 是 它们 的 出 现 似 乎 使 问题 增加 了 难度 。 为 方便 起 
见 ,， 在 没有 负 值 图 时 ,从 * 到 ; 的 最 短路 径 为 0。 





图 98 有 向 图 图 99 带 有 负 值 图 的 图 


在 许多 的 例子 使 我 们 要 去 求解 最 短路 径 问 题 。 如果 顶 点 代表 计算 机 ; 边 代表 计算 机 问 的 
链接 ; 值 表 示 通 信和 的 花费 (每 1 000 字 节 数据 的 电话 费 ), 延迟 成 本 (传输 1 000 字 节 所 需要 的 
秒 数 ) 或 它们 和 :一些 其 他 因素 的 组 合 , 郁 么 我 们 可 能 利用 最 短路 问题 来 找 出 从 一 全 计算机 站 
一 组 其 他 计算 机 发 送 电 子 新 闻 的 最 便宜 的 方法 。 

我 们 可 能 使 用 图 为 航线 或 其 他 大 规模 运输 路 线 建立 模型 并 利用 最 短路 径 算法 计算 两 点 间 
的 最 佳 路 线 。 在 类 位 这 样 的 许多 实际 的 应 用 中 , 我 们 可 能 想 要 找 出 从 一 个 项 点 s BA TH 
5c 的 最 得 路 径 。 当 前 , 还 不 存在 找 出 从 s 到 -- 个 顶点 的 路 径 比 找 出 从 * 到 所 有 顶点 路 径 更 
快 ( 快 多 于 一 个 常数 因子 ) 的 算法 : 

我 们 将 考查 求解 该 问题 四 种 形态 的 算法 - 首先 , 我 们 要 考虑 无 权 最 短路 全 问题 并 指出 由 
何以 O(IE| + 1V') 时 间 解 决 它 。 其 次 , 我 们 还 要 介绍 , 如 果 假 设 没有 负 边 ,那么 如 何 求解 
赋 权 最 短路 径 问 题 。 这 个 算法 在 使 用 合理 的 数据 结构 实现 时 的 运行 时 间 为 OCLE T log | Vi) 

如 果 图 有 负 边 ,我 们 将 提供 一 个 简单 的 解法 ， 不 过 它 的 时 间 界 不 理想 ， 为 
OGEI- IV )。 最 后 , 我 们 将 以 线性 时 间 解 决 无 图 图 的 特 味 情形 下 的 赋 权 的 问题 。 

93.1 无 权 最 短路 径 
图 9-10 表示 一 .个 无 权 的 图 Go 使 用 某 个 顶点 s 作为 输入 参数 , 我 们 起 要 找 出 从 * 到 所 有 
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其 他 项 点 的 最 短路 径 : 我 们 只 对 包含 在 路 径 中 的 过 数 有 兴趣 .因此 在 边 上 不 存在 权 ,, ER, 
这 是 赋 权 最 短路 径 问 题 的 特殊 情形 , 因为 我 们 是 以 为 有 所 有 的 边 部 赋 以 权 1. 





图 9-10 -PERAR G 


BABERE] BK AREA SAO, ion ate Aa 
Fe fal ATE ic al 

没 我 们 选择 s 为 ua. 此 时 立刻 可 以 说 出 从 到 os 的 最 短路 径 是 长 为 0 的 路 径 。 FER MA TR 
个 标记 , 得 到 图 9-11， 


Yi 


o 
Cu 


图 9-11 将 开始 节点 标记 为 通过 0 条 边 可 以 到 达 的 节点 后 的 图 


现在 我 们 可 以 开始 寻找 所 有 与 s 距离 为 1 的 顶点 - 这 些 顶 点 通过 考查 与 s 邻接 的 那些 项 
点 可 以 找到 。 此 时 我 们 看 到 ，wi 和 og 与 s MERA WZ. 我们 把 它 表示 在 图 9-12 中 。 
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最 短路 径 长 为 2。 图 9-13 显示 到 现在 为 止 已 经 做 出 的 工作 。 
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my 
BOIS 找 出 所 有 从 出 发 路 径 长 为 2 的 顶点 之 后 的 峰 


最 后 , 通过 考查 那些 与 刚 被 赋值 的 v; 和 ov, 相 邻 的 项 点 我 们 可 以 发 现 , ws 和 v. 各 有 一 
Aimee. 现在 所 有 的 顶点 部 已 经 被 计算 . 图 9-14 显示 算法 的 最 后 结果 ， 





Eo14 dep ERN 








search) 。 该 方法 按 层 处 理 顶点 : 距 开始 点 最 近 的 那些 顾 点 首先 被 | 
帕 值 ,而 最 远 的 那些 顶点 最 后 被 赋值 这 很 像 对 树 的 层 序 遍 历 | 
(level-order traversal} - 

有 了 这 种 方法 , FRAT AEC ERS. 图 9-15 Bon ix 
法 将 些 用 到 的 记录 过 程 的 表 的 初始 配置 - - 

对 于 每 个 顶点 , 我 们 将 跟踪 全 个 信息 : 首先 , 我 们 把 从 s 开始 ”图 915 用 + 无 权 最 短路 
ATL AEE RRA] d, gh. 开始 的 时 候 , ER s 外 所 有 的 顶点 部 是 计算 的 表 的 初始 配置 
不 可 达到 的 , 而 ;的 路 径 长 为 0。P, 栏 中 的 项 为 簿 记 变 其 ， 它 将 使 我 们 能 够 显示 出 实际 的 路 
15. Known 中 的 项 在 顶点 被 处 理 以 后 置 为 1。 起 初 , 所 有 的 顶点 都 不 是 Known (LZ 8B), 包 
打开 始 硕 点 。 当 一 个 顶点 被 标记 为 已 知 时 , 我 们 就 确信 不 会 再 找到 更 便宜 的 路 径 ， 因 此 对 该 
硕 点 的 处 理 实质 上 已 经 完成 。 

基本 的 算法 在 图 9-16 中 描述 。 图 9-16 中 的 算法 模拟 这 些 网 表 , EBRA d = 0 Law 
点 声明 为 Known, 然后 声明 4 = 1 LEE Known, AMH d 一 2 ARTES A Known. 
等 等 ,并且 将 仍然 是 de= oo MATA SSR AYU w 置 为 距离 d,,=d + l, 

BEW p. Bt, 可 以 显示 实际 的 路 往 。 当 讨论 赋 权 的 情形 时 我 们 将 会 看 到 如 | 何 进 行 。 

HEUER for 循环 , 因此 该 算法 的 运行 时 间 为 OC. VO 这 个 效率 明显 地 低 ， 因为 
尽管 所 有 的 顶点 早 就 成 为 Known T, 但 是 外 层 糊 环 还 蚌 雪 继续 ， 直到 Num Vertex — 1 为 止 - 
虽然 额外 的 附加 测试 可 以 避免 这 种 情形 发 生 , 但 是 它 并 不 能 影响 最 坏 情形 运行 时 间 ， 当 以 图 
9-17 中 的 从 顶点 wo 开始 的 图 作为 输入 时 ， 通过 将 所 发 生 的 情况 推广 由 可 看 到 这 一 战 。 





void 
Unweighted( Table T 3 /* Assume T is initialized */ 


i 
| int CurrDist; 
Vertex V, W; 


| fe Vee for( Currbist = 0; Curr st < humVertex: Currbist++ ) | 
1 Qe for each vertex V 

fe 3 if C ITD V ].Known && TE V ].Dise == CurrDist ) | 

| : 

| fe 6M TL V ].Known = True; 

fs otf fer each W adjacent to V 
| /* Brr ift TU W J.Dist == Infinity ) 
| 1 

A TE Ww ].Dist = CurrBist + 1; 
| A B"j T W ].Path = V; 


} 
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W016 无 权 最 短路 算法 的 以 代 码 


OE I-O-O-O)-O-O 
图 9-17 ”使 用 图 9 16{ 伪 代码 ) 的 无 权 最 短路 算法 的 坏 情 形 


我 们 可 以 用 非常 燃 似 于 对 拓 外 排序 的 做 法 来 排除 这 种 低 效 性 。 在 任 一 时 刻 , A A 
AQ AR m. 它们 的 ao, ER d, = CurrDist. 而 其 余 的 则 有 cf = CurrDist 
xd. 由 于 这 种 附加 的 结构 , 在 第 2 行 利 第 3 行 搜索 整 个 的 表 以 找 出 合适 顶点 的 做 法 是 非 党 
浪费 的 。 

一 种 砷 党 简单 但 抽象 的 解决 方案 是 保留 两 个 盒子 。 1 十 盒 将 装 有 d, = CurrDist HRA 
Hom 2 SUAS d= CurrDis: + 1 的 那些 顶点 。 在 第 2 行 和 第 3 行 的 测试 可 以 用 得 找 
1 二 合 内 的 任意 顶点 代替 。 在 第 8 行 (if 语句 的 内 部 ) 以 后 , 我 们 可 以 把 w 吉 到 2# 铭 中. 在 外 
i for 循环 终止 以后 , HAESKA, 而 2 寺 盒 则 可 转换 成 1## 盒 以 进行 下 一 趟 for 循环 。 

我 们 世 到 可 以 使 用 一 个 队列 把 这 种 想法 进一步 精 化 。 在 近代 开始 的 时 收 ， 队列 只 含有 距离 
为 CurrDist 的 那些 硕 点 。 当 我 们 添加 距离 为 CarrDig + 1 的 那些 邻接 顶点 时 ， 由 于 它们 自 队 尾 
人 也 ,因此 这 就 保证 它们 直到 所 有 距离 为 Cer Dist. 的 顶点 都 被 处 理 之 后 才 被 处 理 。 在 趾 离 为 
Curr Dist 处 的 最 后 一 个 顶点 出 队 并 被 处 理 之 后 ,队列 只 含有 距 议 为 CurrDist + 1 AAR, 因此 
该 过 程 将 不 断 进行 下 去 , 我 们 只 需要 把 开始 的 节点 放 人 队列 中 以 启动 这 个 过 程 即 可 。 

精炼 的 算法 在 图 9-18 中 表 出 。 在 伪 代 码 中 , 我 们 已 经 假设 开始 顶点 s 是 知道 的 是 下 | 
Dis 为 0.C 例 程 可 能 把 s 作为 参数 传递 。 BER, 如 果 某 些 项 点 从 开始 节点 出 发 是 不 可 到 这 
的 .那么 有 可 能 除 列 会 过 早 地 变 空 。 在 这 种 情况 下 , 将 对 这 些 节点 报 出 Infinity( 无 穷 ) 距 离 ， 
六 就 完全 合理 了 。 最后, Known 域 没有 使 用 ; 一 个 顶点 一 旦 被 处 理 它 就 从 不 再 进入 队列 , A 
此 产 不 背 要 重新 处 理 的 事实 就 意味 着 做 了 标记 。 这 样 -- 来 , Known 域 可 以 去 掉 。 图 9-19 fitim 
我 们 一 直 在 使 用 的 图 上 的 值 在 算法 期 间 是 如 何 变化 的 。 我 们 保留 Known 域 为 的 是 使 得 过 更 
窑 易 小 用 并 使 得 与 本 节 其 余部 分 保持 一 致 。 

Ex ip SEE EC E A Fr ED. 我们 看 到 ， 只 要 使 用 邻接 表 ,， 则 运行 时 间 就 是 
OUE! + (Vi). 


void 
Unweighted( Table T 3 /* Assume T 15 initialized ¿Fig 9.30) */ 
i 


Queue Q: 
| Vertex V, W; 
| f* 1*7 Q = CreateQueue( NumVertex ); MakeEmpty( Q J; 
/* tnQueue the start vertex 5, determined elsewhere */ 
| y* 2*/ Enqueue( S, Q); | 
| je 3*/ while( !IsEmpty( Q ) ) | 
| 
fr 4x? y = Degueue Q }; 
ft 5*7 TL V ].Known = True; /* Not really needed anymore "/ | 
y* 6*/ for each W adjacent to V 
T= TÉ iff TE w ].Dist == Infinity ) 
1 
/* Bw TUE W ].Dist = TL V ].Dist + 1; | 
ft Qa TL W ].Path = V; | 
/*10*/ Enqueue( W, Q 3; | 
l 
} ! 
f*1l*/ DisposeOueue( Q 3; /* Free the memory */ 
| | 
d rrr rr 一 一 一 一 一 — 





图 9-18 无 权 最 短路 算法 的 伪 代 码 


T ot o i 


i 
" 
} 
=x 


Known 


whom a du ERA tk 





图 9.19 无 权 最 短路 算法 期 间 数 据 如 何 变 化 


9.3.2 Dijkstra 算法 | uU 
如 果 图 是 峰 权 图 , 那么 问题 (明显 地 ) 就 变 得 困难 了 ， 不 过 我 们 仍然 可 以 使 用 来 自 光 权 情 


形 时 的 想法 。 | mE 
我 们 保留 所 有 与 前 面相 同 的 信息 - 因此 , 每 个 顶点 或 者 标记 为 Known( 已 知 ) 的 , 或 者 标 


记 为 unknown( 未 知 ) 的 。 像 以 前 一 样 ， 对 每 一 个 顶点 保留 一 个 临时 距离 d,。 这 个 距离 实际 上 
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A 一 一 -- 一 


是 使 用 已 知 顶点 作为 中 间 顶 点 从 s Bb o 的 最 短路 么 的 长 。 和 以 前 一 样 ， 我 们 记录 pu. CEJ 
Hd. 变化 的 最 后 的 上 原点， 

解决 单 源 最 短路 共 问 题 的 一 般 方 法 叫做 Dijkstra $32; (Dijkstra's algorithm) . 这 个 有 30 
E pg se aft ike de db HE ( greedy algorithm) 最 好 的 例子 。 贪 焚 算 法 一 般 地 分 阶段 求解 一 个 问 
ml. 在 每 个 阶段 它 都 把 当前 由 现 的 当 作 是 最 好 的 去 处 理 。 例如， 为 了 用 美国 货币 找 零钱 .大 
部 分 人 首先 数 出 若干 25 分 一 个 的 硬币 (quarter), 然后 是 若干 一 角 币 ,五 分 币 和 一 分 币 。 这 种 
贪 禁 算 法 使 用 最 少数 目的 硬币 找 和 零钱 , 贪 焉 算法 主要 的 问题 在 于 , 该 算法 不 是 总 能 够 成 功 . 
为 了 找 还 15 美 分 的 零钱 ， 如 添加 12 美 分 一 个 的 货币 则 可 破坏 这 种 找 零 钱 算 法 ,因为 此 时 它 
给 出 的 答案 { 一 个 12 分 币 和 -二 个 分 币 ) 不 是 最 优 的 (一 个 角 币 和 一 个 五 分 币 )。 

. Dijkstra BPE RIAN AS REA E, PE BEET. 在 每 个 阶段 ，Dijkstra 算法 选择 一 
个 原点 v. 它 在 所 有 未 知 顶点 中 具有 最 小 的 da 同时 算法 声明 从 到 ”的 最 短路 径 是 已 知 
的 ， 阶 段 的 其 余部 分 由 do 值 的 更 新 工作 组 成 。 

在 无 权 的 情形 , Bad, = © 则 置 = d+ 1. 因此, 若 硕 点 w 能 提供 一 条 更 短路 径 , 则 
我 们 本 质 上 降低 了 do 的 值 。 如 果 我 们 对 赋 权 的 情形 应 用 同样 的 逻辑 , 那么 当 di 的 新 值 
d. c. ,是 一 个 改进 的 值 时 我 们 就 置 4 = qd. + cu uso 简 言 之 ,使 用 通 向 w Be LETRAS v 
是 不 是 一 个 好 主意 由 算法 决定 。 原 始 的 值 d. 是 不 用 vw 的 值 ; 上 面 所 算出 的 值 是 使 用 o CORE 
仅 那 些 已 知 的 顶点 ) 最 便宜 的 路 径 。 

图 9-20 中 的 图 是 一 个 例子 。 图 9-21 表示 初始 配置 , 假设 开始 节点 s 是 zi- 第 个 选择 的 
顶点 是 v, 路径 的 长 为 0, 该 硕 点 标记 为 已 知 。 既然 v CA, 那么 基 些 表 项 就 需要 调整 。 邻 
接 到 v. 的 顶点 是 v 和 ovis 这 两 个 顶点 的 项 得 到 调整 ,如 图 9-22 PEFR o 





图 9-21 用 于 Dijkstra 图 922 fF uw, WE 
9-20 AEG 算法 的 表 的 初始 配置 明 为 已 知 后 的 表 


下 一 步 , 选取 ws 并 标记 为 已 知 。 硕 点 vs. us. ve. u7 是 邻接 的 顶点 , 而 它们 实际 F 都 需 
要 调整 ,如 图 9-23 所 示 。 

接着 选择 e. v 是 邻接 的 点 , 但 已 经 是 已 知 的 , 因此 对 它 没 有 工作 要 做 。vs 是 邻接 的 点 
但 不 做 调整 , 因为 经 过 w 的 值 为 2 + 10 = 12.8 KO 3 的 路 径 已 经 是 已 知 的 。 图 9-24 指出 
在 这 些 顶 点 被 选取 以 后 的 表 。 

下 一 个 被 选取 的 项 点 是 vs, BAW 3. 07 是 惟一 的 邻接 顶点 ， 但 是 它 不 用 调整 AA 
34625. 然后 选取 v 对 o 的 距离 下 调 到 3 + 5 = 8. 结果 如 图 9-25 Pro 

再 下 一 个 选取 的 项 点 是 v7 ve 下 调 到 5 + 1 = 6. 我 们 得 到 图 9-26 所 示 的 表 。 

最 后 , IDEE ve 最 后 的 表 在 图 9-27 中 表 出 - 图 9-28 通过 图 形 演示 在 Dijkstra 算法 期 
闻 各 壹 是 如 何 标记 为 已 知 的 以 及 项 点 是 如 何 更 新 的 。 





E 9-23 FE vy Hg 9.24 FF v [E 0-25. 在 :xs 然后 uy 
被 声明 为 已 知 后 被 志明 为 已 知 后 





图 9-26 在 o; RPA AE Ae 图 0-27 在 re 被 声明 为 已 知 后 ,算法 终止 


为 了 显示 出 从 开始 顶点 到 某 个 顶点 o 的 实际 路 径 ， RIND DASS — 1 3E UH (LER ER E. p 
数组 留 下 的 足迹 ， 

MER HCH Dijkstra 算法 的 伪 代 码 。 我们 将 假设 ,为 方便 起 见 , 这 些 [jt AMO 到 
Num Verter — 1 RS (ILE 9-29) 并 假设 通过 例 程 ReadGraph 我 们 的 图 可 以 被 读 入 到 一 个 邻接 
XU. 

在 图 9-30 的 例 程 中 ， 开始 的 顶点 被 传递 到 初始 化 例 程 中 。 RS Pe AE Fe 
质点 的 地 方 。 

利用 图 9-31 中 的 递归 例 程 可 以 显示 出 这 个 路 径 。 该 例 程 递归 地 吕 示 出 直到 顶点 o B TRI 
的 顶点 的 整个 路 径 . 然后 再 显示 顶点 w。 这 是 没有 问题 的 ,因为 路 径 是 简单 的 

图 9.32 列 出 主要 的 算法 ， 它 就 是 -- 个 使 用 贪 禁 选 取 法 则 填 表 的 for TS 

利用 反 证 法 的 证 明 将 指出 , 只 要 没有 边 的 值 为 负 ,该 算法 总 能 够 顺利 完成 - 如 果 任 何 一 边 出 
现 负 值 , 则 算法 可 能 得 出 错误 的 答案 ( 见 练习 9.7a)。 运行 时 间 依 来 于 对 表 的 处 理 方法 , 我 们 必须 考 
虚 , 如 果 通 过 使 用 扫描 表 来 找 出 最 小 值 d 那么 每 一 步 将 花费 OC | V1) 时 间 找 到 最 小 值 , 从 而 整 
个 算法 过 程 将 花费 OU VERMA. 每 次 更 新 du 的 时 间 是 常数 , 而 每 条 边 最 多 有 -次 
更 新 ,总 计 为 OUE). 因此, 总 的 运行 时 间 为 DG 下 | + [Lv = OVi). 如 果 图 是 稠密 的 ， 
xi EI = ed vi^» 则 该 算法 不 仅 简单 而 且 基 本 上 最 优 ， 因为 它 的 运行 时 间 与 边 数 成 线性 关系 。 

appe SEA, DIE! = eVI}, 那么 这 种 算法 就 太 爆 了, 在 这 种 情况 下 , 距离 
需要 存储 在 优先 队列 中 。 有 两 种 方法 可 以 做 到 这 一 损 ， 二 者 是 类 似 的 。 

第 2 行 与 第 5 行 联合 形成 一 个 DeleteMin 操作 ， 因为 一 旦 未 知 的 最 小 值 顶 点 被 找到 , Hi 
么 它 就 不 再 是 未 知 的 , 以 后 不 再 考虑 。 在 第 9 行 的 更 新 有 两 种 实现 方法。 

-种 方法 是 把 更 新 处 理 成 DecreaseKey EE, ERT, 查找 最 小 值 的 时 间 为 O Clog | Vl, 
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即 为 执行 那些 更 新 的 时 间 , 它 相 当 于 执行 那些 DecreaseKey 操作 的 时 间 ,. 由 此 得 出 运行 时 间 
A OGE! log [IV| + (Vi log IVI) ~ OC Fj log (Vi), AEX) Bi E BGT E BS FE BY oH, 
出 于 优先 队列 不 是 有 效 地 支持 Find 操作 , ltt d; 的 等 个 值 在 优先 队列 的 位 置 将 需要 保留 并 
4d, 在 优先 队列 中 改变 时 更 新 。 奶 果 优 先 队 列 是 用 一 尺 玲 实现 的 , 那么 这 将 很 难 办 - WSR HE 
用 配对 堆 {pairing heap 一 一 见 第 12 竟 )， 则 程序 不 会 太 益 。 















typedef int Vertex; 
struct TableEntry 


Header; /* Adjacency list */ 
int Known ; 
DistType Dist; 
Vertex Path: 


}; 


/* Vertices are numbered from 0 */ 
#define NotAVertex (-1) 
typedef struct TableEntry Table[ NumVertex ]: 





图 9-29 Dijkstra 算法 的 声明 





InitTable( Vertex Start, Graph C, Table T ) 
{ 


int i: 
A 1*/ ReadGraph( G, T 3; /* Read graph somehow */ 
| f* 2*/ for( i = 0; i < NumVertex; i++ ) 
| 
， ,F8. 35 Ti i ].Known = False; 
/* APF TE i J.Dist = Infinity: 
Ae Shy TI i ].Path = NotA¥Vertex; 
} 
/* &*/ TE Start ].dist = 0; 





E 9-30 表 初 始 化 例 程 


| /* Print shortest path to V after Dijkstra has run */ 


/* Assume that the path exists */ | 
| void 
PrintPath( Vertex V, Table T ) 


iff TE Vv ].Path !- NotAVertex ) 
| 
PrintPath( TI V J.Path, T 3; 
printf " to" 5; 


l 
printf( "Sv", V J); /* Xv is pseudocode */ 





图 9-31 显示 实际 最 短路 径 的 例 程 




















void 
Dijkstra( Table T } 


{ 
Vertex V, Wi 


/* l*Á for( : : ) 
/* 2*/ | V - smallest unknown distance vertex; 
/" 3*/ ifi V == NotAVertex ) 
f* A break; 
i A bef TU V J].Known = True; 
| o /* 6*/ for each W adjacent to V 
ft 7? ifC !T[ w ]. Known 2 
/* arf if( TL V J.Dist + Cyw < TE W ].Dist 2 
| /* Undate W */ 
/* 9*/ Decreasef TE w j.Dist to 
T[ V ].Dist + Cyw ); 
/*10*/ TE W J.Path = V; 





819.32 Diksira 算法 的 伪 代 但 
品种 方法 是 在 每 次 执行 第 9 行 时 把 w 和 新 值 d 搬入 到 优先 队列 中 去 。 RE. AH 
以 列 中 的 每 个 项 点 就 可 能 有 多 干 一 个 的 代表 。 当 DeleteMin 操作 把 最 小 的 顶点 从 优先 从 放 中 
删除 时 ,必须 检查 以 肯定 它 不 是 已 经 知道 的 。 这 样 , 第 2 行 变 成 一 个 循环 , 它 执行 DeleteMin 
二 到 一 个 未 知 的 硕 点 合并 为 止 - 这 种 方法 虽然 从 软件 的 观点 看 是 优越 的 .而且 编程 确实 容 妇 
得 多 , 但是， 队列 的 大 小 可 能 达到 | F | 这 么 大 . HT'ELIXIVI BRA log | E; € 
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2log | Vi, bie 3E SE eg ET fa] FE. 这样, 我们 仍然 得 到 一 个 OOE| jog ' V1) 算 法 .不 
过 ,空间 需求 的 确 增 衣 了 , 芷 某 些 应 用 中 这 可 能 是 严重 的 。 不 仅 如 此 , IN AIRE EX 
而 不 是 仅仅 1 次 DeieteMin， 所 以 它 在 实践 中 很 可 能 要 慢 。 

注意 ,对 于 一 些 诸如 计算 机 邮件 和 大 型 公交 传输 的 典型 问题 , 它们 的 图 一 般 是 非 贡 稀 呈 的 ， 
因为 太 各 数 原点 只 有 少数 几 条 边 ,。 因此 ,在 许多 应 用 中 使 用 优先 队列 来 解决 这 种 问题 是 很 重要 的 ， 

如 果 使 用 不 同 的 数据 结构 , 那么 Dijkstra 算法 可 能 会 有 出 好 的 时 间 界 . 在 第 [1 5E. 我 们 
将 看 到 男 寻 的 优先 队列 数据 结构 .叫做 翡 波 那 契 堆 (Fibonacci heap). 使 用 这 种 数据 结构 的 运 
PA HE OC FE! + IVI log | VI). PRI RERA ELIT IRE BT TH] ER. A. Ea EH S 
He ug BRIER. 因此 , SE AS ESE HE TP SEB SEHE LEER HEEL ER Dijkstra 
算法 吏 好 : 不 用 说 , 这 种 问题 没有 平均 情形 的 时 间 结 果 , BAR ae ye erg ve BR BLES BL SEU 
PR AR fie AY AY i 
39.3.3 RAMi E 

An EUG gf, BE. Dijkstra 算法 是 行 不 和 通 的 。 问题 在 于 , 一 互 一 个 顶点 a PE 
知 的 , 那 就 可 能 从 某 个 另外 的 未 知 顶点 w 有 一 -条 回 到 uc 的 负 的 路 径 。 在 这 样 的 情形 下 , 选取 从 
«| v EEIE 的 路 径 要 比 从 到， 但 不 过 > BE 练习 9.7{a) 概 求 构造 一 个 明晰 的 例子 -。 

一 个 诱 人 的 方案 是 将 一 个 常数 4 加 到 每 一 条 边 的 值 上 ,如 此 除去 负 值 边 , 再 计算 新 图 的 
最 得 路 径 问 题 , 然后 把 结果 用 到 原来 的 图 上 , 这 种 方案 不 可 能 直接 实现 , 因为 那些 具有 许多 
条 边 的 路 径 变 得 比 那些 具有 很 少 达 的 路 径 权 剖 更 于 了 。 

反 荆 权 的 和 无 权 的 算法 结合 起 来 将 会 解决 这 个 问题 , 但 是 要 付出 运行 时 间 激 鬼 增 长 的 代 
ft. 我 们 忘记 了 关于 已 知 的 顶点 的 概念 ， 因 为 我 们 的 算法 需要 能 够 改变 它 的 意 癌 。 开始 . 我 
们 把 s 放 到 队列 中 . 然后 , 在 每 一 阶段 我 们 让 一 个 顶点 v HB. ROAD o 邻接 的 顶点 
w. 78 da> dot caso 然后 里 新 du Ap, 并 在 w 不 村 队列 中 的 时 候 把 它 放 到 队列 中 ， 
可 以 六 每 个 顶点 设置 一 个 比特 位 (bit) 以 指示 它 在 队列 中 出 现 的 情况 。 我 们 重复 这 个 过 程 百 到 
队列 为 宝 - 图 933( 儿 平 ) 实 现 这 个 算法 : 





void /* Assume T is initialized as in Fig 9.18 */ 
WeightedNegative( Table T ) 
Í 


Queue Q; 
Vertex V, Wi 
A 0 = CreateQueue( NumVertex 3; MakeEmpty( Q 3; 
jo /7 aes Enqueue( 5, Q 1; /* Enqueue the start vertex 5 */ 
| 
/* 3*/ while? !IsEmpty( Q 5) j 
1 
| y* o 4*/ V = Daqueue( Q J; 
/* otf for each W adjacent to V 
/* otf if( TL ¥ ].Uist + Cvw < TL W ].Dist 3 
/* Update W */ 
ft 7*/ TL W ].Dist = TL V J.Dist + Cvw; 
/* B"/ T[ Ww ].Path = V; 
/* o*/ if( w is not already in Q ) 
/*i10*/ Engueuet W, Q 3; 
] 
j 
/*ll*/ DisposeQueue( Q 7; 
l 





T 


图 933 FOR Re RS 
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ALR ARR GS LR AC HE EE TE TAE, 但 是 , 第 6 行 到 第 10 行 的 代码 每 过 只 执行 - : 
次 的 情况 不 再 成 立 . 每 个 顶点 最 客 可 以 出 队 1 V1 次 , 因此 、 如 采信 用 邻接 表 则 运行 时 间 是 O 
(JE VV ) (练习 9.7b). 这 比 Dijkstra 算法 多 很 多 , cede By. SCEX DA BB dE OD). 如 
尝 负 值 图 存在 , 那么 所 写 的 算法 将 无 限 循 环 下 去 。 通过 在 件 一 质点 已 经 出 队 1V' + 1 次 后 停 
止 算 法 试行 , 我们 可 以 保证 它 能 终止 . 
9.3.4 TAH 

1n 5 RGA EPA, WARA LIRE IE CE ES BH DL SA OLI SALES, e, EDU AR Te i 
HEM | 来 改进 Dijkstra 算法 , 3M LINO DERE TEL. 由 于 选择 和 更 新 可 以 在 拓扑 排 
FEB BSI ETT. 因此 算法 能 够 一 超 完 成 . 

因为 当 一 个 顶点 v BEER LU. 按照 拓扑 排 译 的 法 则 , CRRA YOR MT REA 
所， 因此 它 的 距离 d, 可 以 不 再 被 降低 ,所 以 这 种 选 拌 法 则 是 行 得 通 的 

使 用 这 种 选择 法 则 不 需要 优先 队列 ; 由 于 选择 花费 常数 时 间 , 因此 运行 时 间 为 OCIE|+ 

V 

ABI PE RT La PF HEC SERT $ 1148 E JA A a 到 点 5, HH REGE PIE. mA 
可 能 有 效 。 另 一 个 可 能 的 应 用 是 (不 可 逆 ) 化 学 反应 模型 . 我 们 可 以 让 每 个 项 点 代表 实验 的 一 
个 特定 的 状态 , 证 边 代 表 从 一 种 状态 到 另 一 种 状态 的 转变 ， 市 边 的 权 代 表 释 放 的 能 最 QW 
只 能 从 高 能 状态 转变 到 低能 状态 ,那么 图 就 是 无 圈 图 . 

无 圈 图 的 一 个 更 重 此 的 用 途 是 关键 路 径 分 析 法 (critical path analysis)» 我 们 将 用 图 0-34 
中 的 图 作为 我 们 的 例子 , 每 个 节点 表示 一 个 必须 执行 的 动作 以 及 完成 动作 所 花费 的 时 间 。 因 
此 .该 图 呀 做 动作 节点 图 (activity_node graph)。 图 中 的 边 代表 优先 关系 : Bic, w) Ak 
着 动作 o 必须 在 动作 zw 开始 前 完成 。 当然 , 这 就 意味 着 图 必须 是 元 于 的 : Fi Hec CER CH 
接 或 间接 ) 互 相 丰 依赖 的 动作 可 以 由 不 同 的 服务 器 并 行 地 执行 。 





图 9-34 动作 节点 图 


这 种 类 型 的 图 可以 (并 常常 ) 被 用 来 模拟 方案 的 构建 。 在 这 种 情况 下 , AILS IIS SE I 
4. 首先 , 方案 最 早 完成 时 间 是 何 时 ?从 图 中 我 们 可 以 看 到 , IHE A, C, F, 万 需要 10 个 
时 间 单 位 。 另 一 个 重要 的 问题 是 确定 哪些 动作 可 以 延 尖 , ER EK. 而 不 至 于 影响 最 少 完 成 
时 间 。 例 如 , 延迟 A, C, 下, H 中 的 任 -个 部 将 使 完成 时 间 推 到 10 个 时 间 单 位 以 后 - 另 一 方 
Bi. 动作 BREF, 可 以 被 延迟 两 个 时 间 单 位 而 不 至 于 影响 最 后 完成 时 间 。 

为 了 进行 这 些 运 算 ， 我 们 把 动作 节点 网 转化 成 事件 节点 图 4evencnode graph). 每 个 事件 
对 应 一 个 动作 和 所 有 与 它 相关 的 动作 的 完成 。 从 事件 节点 图 中 的 节点 o 可 达到 的 事件 可 以 在 
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SF v SERT AS. XPT BR sx. Ea A CHE. NEE cx uj SETS Sede A RI 
— “Pah ti fs SL PS Bs EREA. A T S| ERA SEE (aR PEA ER RR), aA 
是 必要 的 .对 应 图 9-34 的 事件 节点 图 如 图 9-35 所 示 。 





图 9.35 事件 节点 图 


为 了 找 出 方案 的 最 时 完成 时 间 , 我 们 只 要 找 出 从 第 一 个 事件 到 最 后 - -个 事件 的 最 长 路 答 
的 长 . 对 于 一 - 般 的 图 , 最 长 路 径 问 题 通 常 没有 意 儿 ,因为 可 能 有 正 值 的 网 ( positive-cost cycle) 
存在 ; 这 些 正 值 轿 等 价 于 最 短路 问题 中 的 负 值 痢 ,。 REL ER ALIE ERR, 邦 么 我 们 可 以 寻找 最 长 
的 简单 路 径 ,不 过 , 对 于 这 个 问题 没有 已 知 的 圆满 的 解决 方案 。 由 于 事件 节点 图 是 无 圈 图 ， 
因此 我 们 不 必 担 心 圈 的 问题 . 在 这 种 情况 下 , 容易 采纳 最 短路 径 算 法 计算 图 中 所 有 蔬 点 最 早 
完成 时 间 。 如 果 EC, 是 节点 i BUR CEU TRE, 那么 可 用 的 法 则 为 

EC,— 0 
EC, — max (EC, + co, w) 


17, u EE 


图 9-36 显示 在 我 们 的 实例 事件 节点 图 中 每 个 事件 的 最 早 完成 时 间 。 


C/3 





图 9-36 Be Sd RATA] 


我 们 还 可 以 计算 每 个 事件 能 够 完成 而 不 影响 最 后 完成 时 间 的 最 晚 时 间 LC;。 进行 这 项 工 
作 的 公式 为 


LC, = EC, 
LC. = _ min J LO, Eo.) 
对 于 每 个 顶点, 通过 一 个 保存 所 有 邻接 且 在 先 的 项 点 的 表 , 这 些 值 就 时 以 以 线性 时 间 算 出 ， 


殿 助 项 点 的 拓扑 顺序 计算 它们 的 最 早先 成 时 司 ， 而 最 晚 完成 时 间 则 通过 倒转 它们 的 拓扑 顺序 
来 计算 . 最 晚 完成 时 间 如 图 9-37 Bras - 





图 9.37 See So ART IB] 
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十 件 节点 图 中 每 条 边 的 松弛 时 间 (slack time}) 代 表 对 应 动作 可 以 被 延迟 而 不 推迟 整体 的 
完成 时 间 量 。 容易 看 出 
Sacki., ew) = LG, — EC, Ca, u 
网 9-38 Jit ite SEP TS a A a PE a CPR AR). Pa A, MERR E 
Fe HL BRENT Val, 底下 的 数 是 最 晚 完成 时 间 。 


rm _ C30 





PA 9-38 最 持 完 成 时 间 、 最 晓 完 成 时 间 各 松弛 时 间 


基 些 动作 的 松弛 时 间 为 零 , uoles ERI SHE, 它们 必须 按 计 划 结 束 。 至少 存 在 
一 条 完全 出 零 -松弛 边 组 成 的 路 径 , 这 样 的 路 径 是 关键 路 径 (critical path). 
9.3.5 所 有 点 对 最 短路 径 

有 时 重要 的 是 要 找 出 图 中 所 有 顶点 对 之 间 的 最 短路 径 。 虽 然 我 们 可 以 运行 | Y| 次 适当 的 
单 源 算 法 , 但 是 如 果 要 立即 计算 所 有 的 信息 , 我 们 还 是 期 望 有 更 快 的 解法 , CAA Te 
的 图 、 

在 第 10 章 , 我 们 将 看 到 对 赋 权 图 求解 这 种 问题 的 一 个 OC WV”) 算 法 。 虽然 对 于 秽 窗 图， 
它 只 有 和 运行 | | 次 简单 ( 非 优先 队列 )Dijkstra 算法 相同 的 时 间 界 , 但 是 循环 是 如 此 地 暴 凌 
以 敏 记 有 专门 的 点 对 算法 很 可 能 在 实践 中 会 更 快 。 当 然 , 对 于 稀 玖 图 哆 快 的 是 运行 Y 次 用 
优先 队列 编写 的 Dijkstra 算法 。 


9.4 MAMA 


设 给 定 边 容量 为 ce。, 的 有 向 图 G = (V, E), 这 些 容 量 可 以 代表 通过 一 个 省 道 的 水 的 
流量 或 在 两 个 交叉 路 口 之 间 马 路 上 的 交道 流量 。 有 两 个 顶点 ,一 个 是 ;, RARA Loure), 
个 是 1， 称 为 收 点 (sink)。 HT-RA, w), ERU TUER co 个 单位 可 以 通过 . 在 
既 不 是 发 点 APERA: 的 任 一 顶点 zw， 总 的 进入 的 流 必 须 等 于 总 的 发 出 的 流 : 最 大 流 问 题 
就 是 确定 从 s 到 可 以 通过 的 最 大 流量 . 例如. 对 于 图 9-39 中 左边 的 图 , 最 大 流 是 5, 如 石 边 
的 图 所 朱 。 


` 
AC 
- 
D 
bh 





图 9390 一 个 图 (左边 ) 和 它 的 最 太 流 
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A, CHL 3T 30 NL a e Mdo DA d 从 a Mb 得 到 3 个 单位 的 流 , 并 把 它们 结合 i; 
来 发 送 到 1 一 个 顶点 可 以 以 它 喜 欢 的 任何 方式 结合 和 发 送 流 ,只 要 不 违反 边 的 容 景 以 太保 
持 流 守恒 ( 进 入 必须 流出 )。 

9.4.1 一 个 简单 的 最 大 流 算法 

解决 这 种 问题 的 首要 想法 是 分 阶段 进行 ,我们 从 图 G 开始 并 构造 -… 个 流 图 G,。G, 表示 
在 算法 的 任意 阶段 已 经 达到 的 流 。 开始 时 Gy 的 所 有 的 边 都 没有 流 , Sell CH EET A qb NI 
(包含 最 大 流 。 我 们 还 构造 一 个 图 G., PARR A (residual graph), 它 表示 对 于 每 条 边 还 能 
再 添加 上 多 少 流 。 对 于 每 -- 条 边 , 我 们 可 以 从 容量 中 减 去 当前 的 流 而 计算 出 残余 的 流 。G; 的 
WOU fig FX ae it (residual edge). 

在 每 个 阶段 , 我 们 寻找 图 G, 中 从 * Ble 的 一 条 路 径 , PRR ET RU KB (augmenting 
pathy。 这 条 路 径 上 的 最 小 值 边 就 是 可 以 添加 到 路 径 每 一 边 王 的 流 的 量 - 我 们 通过 调整 C 和 
重新 计算 G, 做 到 这 -一 点 。 当 发 现在 G, 中 没有 从 xs 到 + 的 路 径 时 算法 终止 : 这 个 算法 是 不 确 
定 的 , 因为 从 * 到 * 的 路 径 是 任意 选择 的 。 显 然 , 有 些 选 择 会 比 另 外 一 些 选择 好 , 后 面 我 们 再 
外 理 这 个 问题 , 我 们 将 对 我 们 的 例子 运行 这 个 算法 。 下 面 的 图 分 别 是 G. G, 和 避 .。 要 记者 这 
个 算法 有 一 个 小 欠缺。 初始 的 配置 见 图 9-40。 





图 940 PL, 沪 图 以 及 残余 图 的 初 妨 阶 段 
在 残余 图 中 有 许多 从 ， 到: 的 路 径 。 假设 我 们 选择 s., doro 此 时 我 们 可 以 发 送 2 个 
单位 的 流通 过 这 条 路 径 的 每 一 过 。 我 们 采 皮 如 上 约定 : 一 巧 注 满 (使 饱和 ) 一 条 边 ,， 则 这 条 过 
就 要 从 残余 图 中 除去 。 这 样 , 我 们 得 到 图 9-41. 





图 941 Ws, b, di 加 大 2 个 单位 的 流 后 的 已、 G. 6, 


Fai. 我们 可 以 选择 路 徐 ;、a ct, 该 路 径 也 容许 2 个 单位 的 流通 过 。 进行 必要 的 调 
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整 后 ,我 们 得 到 图 9-42 中 的 图 - 





图 9-42 Hs, a, ct 加 入 2 个 单位 的 流 后 的 上 GG、 G, 


惟一 剩 下 要 选择 的 路 径 是 *，a , d, 1, 这 条 路 径 能 够 容纳 一 个 单位 的 流通 过 。 结果 得 到 
图 9.43 所 示 的 图 。 





图 9-43 i$ s.a. d. : 加 入 1 个 单位 的 流 后 的 上 GG. G, 





算法 终止 


由 于 + 从 s 出 发 是 不 可 达到 的 . 因此 算法 到 此 终 正 ; 结果 正好 5 个 单位 的 流 是 最 大 值 : 为 
了 看 清 问题 的 所 在 , 设 从 初始 图 开始 我 们 选择 路 径 *，a, d, 1, 这 条 路 径 容 纳 3 个 单位 的 流 , 因 
而 好 像 是 个 好 选择 。 然 而 选择 的 结果 却 使 得 在 残余 图 中 不 再 有 从 :到 + 的 任何 路 径 , 因此 ,我 
们 的 算法 不 能 找到 最 优 解 。 这 是 贷 禁 算法 行 不 通 的 一 个 例 于 。 图 9-44 指出 为 什么 算法 会 失败 。 





9.44 ”如 果 初 始 动 作 是 沿 s.a, d, c 
A 3 个 草 位 的 流 得 到 G、Gr、G, 一 一 算法 终止 但 解 不 是 最 优 的 


为 了 使 得 算法 有 效 , 我 们 需要 让 算法 改变 它 的 意向 。 AK, 对 于 流 图 中 具有 流 fo, 的 每 
一 边 (w，w) ,我们 将 在 残余 图 中 添加 一 条 容量 为 A Alw, v) ERL, REREH 
以 相反 的 方向 发 回 一 个 流 而 使 算法 改变 它 的 总 问 。 通过 例子 最 能 看 清 这 个 问题 。 我 们 从 原始 
的 图 开始 并 选择 增长 通路 s, a. d. c, 得 到 图 9-45 中 的 图 。 





图 845 (FRE A o a.d. (MMA OP PRBS 


注意 ,在 残余 图 中 有 些 边 在 a 和 d 之 问 有 两 个 方向 。 或 者 还 有 一 个 单位 的 注 可 以 从 a 导 i 
向 4, 或 者 有 高 过 3 个 单位 的 流 导向 相反 的 方向 一 -我 们 可 以 撤销 流 。 现 在 算法 找到 流 为 2 ， 
的 增长 通路 s. b, dy a. cy te 通过 从 df Bla 导入 2 个 单位 的 流 , 算法 从 边 (a, a) 取 走 2 个 上 3 出 
单位 的 的 流 ， 因 此 本 质 上 改变 了 它 的 意向 - 图 9-46 显示 出 新 的 图 。 








Elo.46 ”使 用 正确 算法 沿 5， 5. d. a. cc，t 加 入 2 个 单位 的 流 后 的 图 


在 这 个 图 中 没有 增长 通路 , 因此 , 算法 终止 。 奇怪 的 是 , 可 以 证 明 , 如 果 边 的 容量 部 是 有 
理 数 .那么 该 算法 总 以 最 大 流 终止 。 证 明 多 少 有 些 困难 ,也 超出 了 本 书 的 范围 。 虽 然 例 子 正 
EAM, 但 这 并 不 是 算法 有 效 工 作 所 必须 的 。 我 们 使 用 无 圈 图 只 是 为 了 简明 。 

如 果 容 量 都 是 整数 日 最 大 流 为 了, 那么 , 由 于 每 条 增长 通路 使 流 的 值 至 少 增 1, a 
段 足够 ,从 而 总 的 运行 时 间 为 0{f* |E|), 因为 通过 无 权 最 短路 径 算 法 一 条 增长 通路 可 以 
以 OCIE|}) 时 间 找 到 , 说 明 这 个 运行 时 间 为 什么 不 好 的 经 典 例子 由 图 9-47 Som 





NI 
— 
r2 


图 9.47 经 典 的 坏 的 增长 情形 一 一 
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最 大 流通 过 治 每 条 边 发 送 1 000 000 并 查验 到 2 000 000 MAH. 随机 的 增长 通路 可 以 沿 
OPH a 利 户 连接 的 边 的 路 径 连 续 增 长 . 要 是 这 种 情况 重复 发 生 , 那 就 需要 2 000000 条 增长 
通路 ， 而 此 时 我 们 仅 用 2 条 增长 通路 就 能 得 到 最 大 流 ， 

避免 这 个 问题 的 简单 方法 是 总 选择 使 得 流 增长 最 大 的 增长 通路 ,. 寻找 这 样 - :条 路 径 类 似 于 
求解 一 个 赋 权 最 短路 径 问 题 而 对 Dijkstra 算法 的 单线 (singleine) 修 改 将 会 完成 这 项 下 作 - 如 果 
COP mar SERA, 那么 下 以 证 明 . OGE, log cap,,) 条 增长 通路 将 是 以 找到 最 大 流 ,. 在 这 种 
情况 下 , 由 于 对 于 增长 通路 的 每 一 次 计算 都 需要 OC Riog V'OBa. 因此 总 的 时 间 界 为 
OCE “log | VI log capa. do 如果 容量 均 为 小 整数 , MAFRA OCE "log VI) 

男 一 种 选择 增长 通路 的 方法 是 总 选取 具有 最 少 边 数 的 路 径 ， 有 理由 设想 , 通过 以 这 种 方 
式 选 择 路 径 不 太 可 能 使 该 路 径 上 出 现 一 条 小 的 、 对 流 有 限制 的 边 。 使 用 这 种 法 则 , 可 以 证 明 
EE OE VRK, 每 一 步 花费 OC 五 | )， 再 使 用 无 权 最 短路 径 算法 , 产生 运行 时 间 
RA OGEPIVID 

有 可 能 对 这 -算法 进行 进 . : 步 的 数据 结构 改进 , EL PS RIB. 长 期 以 来 对 
界 的 改进 降低 了 该 问题 当前 熟知 的 鼻 。 虽然 尚未 见 到 OCLET; V1) 算 法 的 报告 , te eR 
AR OGElIIVllog VU /Z]IE' DÄ OUE Vit VC 5 的 算法 已 经 被 发 现 { 克 参考 文 
献 ),。 还 有 许多 在 一 些 特殊 情形 下 非常 好 的 界 . 例如 , 车 图 除 发 点 和 收 点 外 所 有 的 项 后 都 有 一 
条 容量 为 1 的 入 边 或 -- 条 容量 为 1 的 出 边 ， 则 沪 图 的 最 大 流 可 以 以 时 间 OC E: V. '“) 找 
到 这 些 图 出 现在 许多 应 用 中 . 

产生 这 些 界 的 分 析 过 程 是 相当 复杂 的 , 并 且 还 不 清楚 最 坏 情 形 的 结果 是 如 何 E SEE PHP 
的 运行 时 间 发 生 关 系 的 。 一 个 相关 的 、 甚至 更 困难 的 问题 是 最 小 值 流 {min-cost flow) 问 题 Be 
某 边 不 仅 有 容量 , 而 且 还 有 每 个 单位 流 的 { 价 ) 值 , 而 问题 则 是 在 所 有 的 般 大 流 中 找 出 一 个 最 
小 { 价 } 值 的 流 来 。 目前 对 这 两 个 问题 的 研究 都 在 积极 地 进行 。 


9.5 最 小 生成 树 


我 们 将 要 考虑 的 下 一 个 器 题 是 在 一 个 匹 向 图 中 找 出 一 棵 最 小 生成 树 Cminimum spanning 
rec). 这 个 问题 对 有 向 图 也 是 有 意义 的 ,不 过 找 起 来 更 困难 . 大 体 上 说 来 , 一 个 无 向 终 G 的 
最 小 牛 成 树 就 是 由 该 图 的 那些 连接 G 的 所 有 项 点 的 边 构 成 的 树 , 匡 其 总 价值 最 低 ; 最 小 生成 
树 存在 当日 仅 当 G 是 连通 的 。 虽然 一 个 健壮 的 算法 应 该 指出 G 不 连 首 的 情况 , 但 是 我 们 还 
是 假设 G 是 连通 的 , 而 把 算法 的 健壮 性 作为 练习 留 给 恋 音 : 

在 图 9-48 中 第 二 个 图 是 第 一 个 图 的 最 小 生成 树 { 碰 睫 还 是 惟一 的 , HE MR -E 
BO. 注意 , 在 最 小 生成 鱼 中 边 的 条 数 为 | V| 一 1。 最 小 生成 树 是 一 棵 树 , AAR; 因为 最 
小 生成 树 包 含 每 一 个 项 点 ,所 以 它 是 生成 树 ; 此 外 , 它 显然 是 包含 图 的 所 有 顶点 的 最 小 的 树 。 
如 果 我 们 需要 用 最 少 的 电线 给 一 所 房子 安装 电路 , 那 就 需要 解决 最 小 生成 树 问 题 。 

对 于 任 一 生成 树 工 , 如 果 将 一 条 不 属于 T 的 边 e WINER, 则 产生 一 个 圈 ， 如 果 从 该 网 
中 除去 任意 一 条 边 , 则 又 恢复 生成 树 的 特性 - MRA e 的 值 比 除去 的 边 的 值 低 ,那么 新 的 后 
成 树 的 值 就 比 原生 成 树 的 值 低 : 如 果 在 建立 生成 树 时 所 添加 的 边 在 所 有 避免 成 圈 的 边 中 便 基 
As, 那么 最 后 得 到 的 生成 树 的 值 不 能 再 改进 ， 因为 任意 一 条 替代 的 边 的 值 都 大 于 等 于 书 经 在 
在 于 该 生成 树 中 的 一 条 边 的 值 . ETE 对 于 最 小 生成 树 这 种 贪 答 是 成 立 的 ; 我 们 介绍 两 种 
算法 ,它们 的 区 别 在 于 最 小 ( 值 的 ) 边 的 选取 上 。 





图 9.48 FH G RIED Ec E CR? 


9.5.1 Prim 算法 

计 等 最 小 生成 柑 的 一 种 方法 是 使 其 连续 好 一 步 步 长 成 。 在 每 一 步 ， EP SE 
根 并 往 上 加 边 , 这 样 也 就 把 相关 联 的 顶点 加 到 增长 中 的 钳 上 。 

在 算法 的 任 一 时 刻 , 我 们 都 可 以 看 到 --- 个 已 经 诺 加 到 树 上 上 的 顶点 集 ， MARA 
到 这 棵 树 中 。 此 时 , 算法 在 每 一 阶段 都 可 以 通过 选择 边 (u，w), Eu. BEERA u 在 [314 
树 上 但 o 不 在 树 上 的 边 的 值 中 的 最 小 者 ， 而 找 出 一 个 新 的 顶点 并 把 它 添加 到 这 棵 树 中 -图 
9 .49 指 出 该 算法 如 何 从 o, 开始 构建 最 小 生成 树 . FAN, v, 在 构建 中 的 树 上 , 它 作为 树 的 根 
但 是 没有 按 。 每 一 步 添加 一 条 边 和 一 个 顶点 到 树 上 。、 
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图 9-49 在 每 一 步 之 后 的 Prim 算法 
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我 们 可 以 看 到 ,Prim 算法 基本 上 和 求 最 短路 从 的 Dijkstra 算法 一 样 , 因此 和 前 面 一 样 ， 
我 们 对 每-- 个 项 点 保留 值 d, Alp, 以 及 一 个 掉 标 , OS RLS EO known) BE BARI 
(unknown) hj- 这 里 , d. 是 连接 ww 到 已 知 顶 点 的 最 短 边 的 权 ， 而 p. UER a, RE RR 
的 项 点 ,算法 的 其 余部 分 完全 一 样 ， 只 有 一 点 不 同 : 出 于 d, 的 定 文 不 同 , 因此 它 的 更 新 法 则 
也 不 同 SL, 更 新 法 则 比 以 前 更 简单 : 在 每 - -个 顶点 eo 被 选取 以 后 .对 十 每 -- 个 与 vw R 
TERR HRI w, da= minl elas Ca ,js 

Ane) eR P 9-50 指出 。z PEER, v, v3. vy 被 更 新 结果 由 图 9-51 中 的 表 指 
册 下 一 个 顶点 选取 S. 每 一 个 质点 部 与 v, 邻接 . v 不 考虑 ,因为 它 是 已 知 和 的 . vs PE, 
因为 d= 2 而 且 从 và 到 o; 的 边 的 值 是 3; 所 有 其 他 的 顶点 都 被 更 新 8 9-52 显示 得 到 网 结 
E 下 -个 要 选取 的 顶点 是 vs。 这 并 不 影响 任何 路 离 。 然 后 选取 v 它 影响 到 we IER, M 
[& 9-53, 选取 v; 得 到 图 9-54, o; 的 选取 迫使 v6 和 ws 进行 调整 。 然后 分 别 选取 vg 和 vs, $ 
法 元 成 . 

最 后 的 表 在 图 9-55 中 给 出 , ERRATA ARPER: (ug, uy). Cus. t4), Cea, 
v). Cus, V7)» ( Us. v1). v3, Vala 生成 树 总 的 值 是 16 




















Hj 0-50 在 Prim 算法 中 图 9-51 XE vj [8 9-52 TE v, 
i RE SE RS 声明 为 已 知 后 的 表 声明 为 已 知 后 的 表 
i Known 4, Pe | 
no o' | B d 
| LI l 2 t'I i 
ea | 
ey 1 á v | 
Pa l | m 
un i 4 gà 
[] 9-53 TE t 和 us 图 9-54 在 vw 图 955 XE vj Mus 
LAP AAG PAR T8 HH A UE Be PERG HR Prim 算法 终止 )} 


该 算法 整个 的 实现 实际 上 和 Dijkstra 算法 的 实现 是 一 样 的 . 对 于 Dijkstra BE ay A AT 
的 每 APSE LAA PAREA, Prim 算法 是 在 无 向 图 上 运行 的 . 因此 当 编 写 代 码 
的 时 候 要 记 住 把 每 一 条 边 都 要 放 到 两 个 邻接 表 中 。 APR A OC. V7). EXT 
ASE EY PE «HE TT Tle OC Ejlog| V D, SF RRM Tz 3E— T 


ABE. 





9.5.2 Kruskal 算法 Un x* f] 
BH AE a a EE R DATE, FRAMERS |o 1 mm 

i By d: o ges oo o 6 该 算法 对 于 前 而 例子 中 的 网 的 | ium zr 
实现 过 程 如 图 9-56 所 示 。 [uer 2 接受， 
形式 上 ，Kruskal 算法 是 在 处 理 一 个 条 林 一 一 树 的 集合 开始 的 oos s as d 
Oe, (El Vi 棵 单 节点 树 ,而 添加 一 边 则 将 两 棵 树 合并 成 -- 棵 树 。| 5 ARS 
当 儿 法 终止 的 时 候 ,就 只 有 一 棵 树 了 ,这 棵 树 就 是 最 小 生成 岩 。 图 — 
9-57 TrA BUS DLL CB AS sS Kruskal Rui 
施 于 图 GER 








Bl957 存 每 -- 生 之 后 的 Kruskal 算法 
当 添 加 到 森林 中 的 边 是 够 多 时 算法 终止 。 实际 上 , 算法 就 是 要 决定 边 (x，w) 应 该 添加 还 
是 放弃 。 前 一 音 中 的 Union/Find 算法 在 这 里 通用 。 
我 们 用 到 的 一 个 恒定 的 事实 是 , 在 算法 实施 的 任 一 时 刻 ,， 两 个 顶点 属于 同 ~ 个 集合 当日 
仅 当 它们 在 当前 的 生成 森林 (spanning forest) EM o 因此 , 每 个 顶点 最 初 是 在 它 自己 的 集合 
Ih, Wwe 和 w 在 同一 个 集合 中 , 那么 连接 它们 的 边 就 要 放弃 , 因为 由 于 他 们 已 经 连通 了 ， 
轨 此 再 洪 加 边 { wx，w) 就 会 形成 一 个 圈 。 如 果 这 两 个 硕 点 不 在 同一 个 集合 中 , 则 将 该 过 加 入 ， 
并 对 包含 项 点 a Me 的 这 两 个 集合 实施 一 次 合并 ,. 容易 看 到 ,这样 将 保持 集合 不 变性 , 因为 
-HfiCu, vw) 添加 到 生成 森林 中 , Aw 连通 到 4 而 x 连通 到 vw， Wa Re 必然 是 连通 的 , A 
此 属于 相同 的 集会 . 
固然 , 将 边 排序 可 便于 选取 , 不过, 用 线性 时 间 建 立 一 个 堆 则 是 更 好 的 起 法 此 时 ， 
DelereMin 将 使 得 边 依 序 得 到 测试 。 典型 情况 下 . 在 算法 终止 前 只 有 一 小 部 分 边 需 要 测 这 ， he 
mter t bb iris A v ERE. 例如, 假设 还 有 一 个 项 点 vs 以 及 值 为 100 的 边 ( us, ve). BS 


那么 所 有 的 边 就 会 都 要 考察 到 ,图 9-58 PHK Kukal 可 以 找 出 一 棵 最 小 生成 树 ， 因 为 一 条 n 
浪 出 三 部 分 数据 组 成 ， 所 以 在 某 些 机 器 上 把 优先 队 刻 实现 成 指向 边 的 指针 数组 比 实现 成 边 的 数 13181 


组 更 为 有 效 。 这 种 实现 的 效果 在 于 , 为 重新 排列 堆 ,需要 移动 的 只 有 那些 指针 ， 而 大 量 的 记录 划 
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void 
Kruskal( Graph G } 
i 


tnt EdgesAccepted; 
DisjSet 5; 
PriorityQueue H; 
Vertex U, V; 
SetType Uset, V5set; 


Edge E; 
/* l*/ Initializet 5 J; 
"LE I ReadGraphIntoHeapArrayt ú, H 5; 
fe aes BuildHeap( H 3: 
f* 45 EdgesAccepted = 0; 
A 5*6 while( EdgesAccepted < NumVertex - I ) 
/* 6*/ © E = DeleteMin( H ); /* E = (U,V) */ 
f* PR Lset = Find( U, 5 X; 
f® arf Vset = Find( V, 5 ); 
!* orf ifC Uset != Vset ) 
1 
/* Accept the edge */ 
/*10*/ EdgesAccepted++; 


/*11*/ SetUnion( 5, USet, V*5et 3; | 
| | 


Po 
图 9-58 Kruskal BRA BA TIS 
OSES OCLE log | EO, 它 受 堆 操作 控制 , 注意 . HE, = 
OC\V\2), 因此 这 个 运行 时 间 实 际 上 是 OC! Ej log, Vi). 在 实践 中 ， AES thie PAT A 
指示 的 时 间 快 得 多 ， 


9.6 深度 优先 搜索 的 应 用 


深度 优先 搜索 (depth_first search) 是 对 先 序 遍历 (preorder traversal) 的 推广 。 我 们 从 某 个 顾 
Jos 开始 处 理 v, 然后 递归 地 遍历 所 有 与 v 邻接 的 顶点 。 加 果 这 种 过 程 是 对 一 棵 树 进 行 , AB 
和 义 , 由 于 |E| = ecc VO, 因此 该 树 的 所 有 的 项 点 在 总 时 间 OUIE|) 内 都 将 被 系统 地 访问 
Al 如果 我 们 对 任意 的 图 行使 该 过 程 , 为 了 避免 图 我 们 需要 小 心 仔细 , 为 此 ， 当 我 们 访问 一 
个 顶点 v 的 时 候 , 由 于 我 们 当时 已 经 到 了 该 点 处 ， 因此 可 以 标记 该 点 是 访问 过 的 , 并 且 对 于 
尚未 被 标记 的 所 有 邻接 顶点 递归 调用 深度 优先 搜索 。 我们 假设 ,对 于 无 向 图, BRI ve, w) 
在 邻接 表 中 出 现 两 次 ; 一 次 是 (u， w), 另 一 次 是 (ww, v). 图 9-59 中 的 两 数 执行 一 次 深度 优 
先 搜 索 ( 此 外 绝对 什么 也 不 做 ),， 从 而 是 一 个 通用 风格 的 模板 : 











vod 
Dfs( Vertex V ) 
i 


visited[ V ] = True; 

for each W adjacent to V 
fC WWisited~ W ] } 

DfsC WoO; 


图 9.59. ”深度 优先 搜索 模板 


(全 局 ) 布 尔 型 数组 Visited 初始 化 成 als. 通过 只 对 那些 尚未 被 访问 的 节点 递归 调用 
eR E. 我 们 和 保证 不 会 隧 人 无 限 的 循环 : 如 采 疼 是 无 回 的 日 不 连通 , 或 是 有 同 的 但 非 踢 过 通 
H3. 这 种 方法 可 能 会 访问 不 到 其 些 节 所。 此 时 ,我 们 搜索 - TCRKTEBRIDBUTS 4. EA bx HD 
度 优先 遍 让 ,并 继续 这 个 过 程 直到 不 存在 未 标记 的 节点 为 止 。- 国 为 该 太 法 保证 每 一 条 边 只 
访问 一 次 , 所 以 只 要 使 用 邻接 表 , 则 技 行 志 历 的 总 时 间 就 是 口 (| 开 + [VIX 
9.6.1 无 向 图 

尤 向 图 是 连通 的 ， 当 岂 仅 当 从 和 任 一 季 点 间 始 的 深度 优先 搜索 访问 到 每 一 个 节点 . 因为 这 
项 测试 应 用 起 来 非常 容易 ， 所 以 我 们 将 假设 我 们 处 理 的 图 者 是 连 遂 的 ,如 采 它 们 不 连 遂 ， 那 
么 我 们 可以 找 出 所 有 的 连通 分 支 并 将 我 们 的 算法 依次 应 用 于 每 个 分 交 。 

作为 深度 优先 搜索 的 一 个 例子 , RER 9-60 的 图 中 我 们 从 A 点 开始 . 此 时 , Bid AN 
访问 过 的 并 递归 调用 Djs (8B) DACAR B 为 访问 过 的 并 递归 调用 DCC)。DARCC) 标 记 
C Ata MISTS DGD). Dis DRR A AB, 但 是 这 了 两 个 节点 部 已 经 被 访问 过 
了 了 .因此 设 有 递归 调用 盯 以 进行 。D 记 1D) 也 看 到 C 是 邻接 的 顶点 , Cw co, Ne 
在 这 里 也 没有 递归 调用 进行 ,于 是 DE(D) 返 加 到 DCC). DASCCYUESI B 是 邻接 总 ， AM 
€. 并 发 现 以 前 设 看 见 的 顶点 E 也 是 邻接 点 ,因此 调用 DCE). DELIEY E 作 标 记 , 忽略 
ARC, JE Bl] DACC). PRIOC) 返 回 到 D&B). Df5CB)AUBR A AD FB. Dfs CA) 
2 DAE 旦 返回 (我 们 实际 上 已 经 接触 每 条 边 两 次 , 一 次 是 作为 边 (w， w), P-E 
‘oe, v), 但 这 实际 上 是 每 个 邻接 表 项 接触 一 次 。} 


AD. 





9-60 一 个 无 向 图 


我 们 以 图 形 来 描述 深度 优先 生成 树 (depth-first spanning tree} 的 步骤 , 该 树 的 根 是 A, JE 
第 -个 被 访 疝 到 的 项 点 。 图 中 的 每 LEXICO. we EB ITE |. 如 果 当 我 们 处 理 (v, ew DT 
发 现 ww 是 未 被 标记 的 , BARMA w, ww) 时 发 现 是 本 标记 的 ， 那么 我 们 就 用 树 的 一 -条 
JADRE. 如果 当 我 们 处 理 (w, wR w 已 被 标记 , HE ARNAR w, v) ABE ”也 
已 有 标记 , 那么 我 们 就 画 一 条 虚线 ,并 称 之 为 背 向 边 (back edge), Ix I” Cp NE 
树 的 一 部 分 , 图 9-60 中 的 图 的 深度 优先 搜索 在 图 9-61 HRH- 


oo 其 实现 的 一 种 有 效 方 法 是 从 v, 开 巡 深度 优先 捧 索 - 如 果 我 们 需要 重新 升 冶 深度 优先 搜索 , 则 考虑 一 个 末 怀 记 的 
硕 点 序 到 oy, wyey AP 让- 是 最 后 - -次 深度 优先 搜索 开始 的 而 成 。 这 保证 整个 算法 只 花费 OCEV DRE RAE E 
那些 使 新 的 深度 优先 搜索 树 开始 的 项 以 
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i321, 图 961 上 图 的 深度 优先 搜索 


树 将 模拟 我 们 执行 的 遍历 。 只 使 用 树 的 边 对 该 树 的 先 序 编号 告 沂 我 们 这 些 灰 点 被 标记 的 
MERE. 如果 图 不 是 连通 的 , 那么 外 理 所 有 的 节点 (和 边 ) 则 沉 贤 多 次 调用 Dfs, 每 次 都 生成 一 标 
pj. 整个 集合 就 是 深度 优先 生成 森林 {depth-first spanning forest). 

9.6.2 双 连 通 性 

如 果 一 个 连通 的 无 向 图 中 的 任 一 原点 删除 之 后 , 剩 下 的 图 仍然 连通 , 那么 这 样 的 无 向 连 
遂 图 就 称 为 是 双 连 通 的 (biconnected)。 上 例 中 的 图 是 冯 连 通 的 。 WRAP OBS aL, 
JEE, 那么 , 车 大 任 一 台 计 算 机 出 故障 而 不 能 运行 , 则 网 络 邮 件 并 不 受 影响 ， CHER, 与 这 
台 坏 计算 机 有 关 的 邮件 除外 。 类 似 地 ， 如 果 一 个 公共 运输 系统 是 双 连 通 的 , MA, BR 
点 被 破坏 , 则 用 户 总 可 选择 另外 的 旅行 路 径 。 

如果-- 个 图 不 是 双 连 通 的 , 那么 , 将 其 删除 后 图 将 不 再 连通 的 那些 项 点 叫 做 割 点 (artieu- 
lation point), 这些 节点 在 许多 应 用 中 是 很 芋 要 的 。 图 9-62 中 的 图 不 是 双 连 通 的 : MA C RID 
是 割 点 . 删除 顶点 C 使 图 G 不 连通 ,而 删除 质点 D 则 使 E 和 下 从 图 G 的 其 余部 分 断 离 





图 9-62 HAHA CADRE 


深度 优先 搜索 提供 一 种 找 出 连通 图 中 的 所 有 制 点 的 线性 时 间 算法 。 首 先 ,， 其 图 中 任 一 而 
点 开始 ,执行 深度 优先 搜索 并 在 顶点 被 访问 时 给 它们 编号 。 对 于 每 一 个 顶点? 我 们 称 其 先 序 


编号 为 Num (ve). 然后 ,对 于 深度 优先 搜索 生成 树 上 的 每 一 个 项 总 v. 计算 编号 最 低 的 项 点 ， 
我 们 称 之 为 lowly). 该 点 从 o 开始, 通过 树 的 寒 条 或 多 条 边 末 可 能 还 有 一 条 背 癌 边 厢 (以 
该 序 ) 达 到 图 9-63 中 的 深度 优先 搜索 树 首先 指出 先 厅 编号 ,然后 指出 在 上 述 法 则 下 可 达到 
的 最 低 凡 号 玩 点 。 


PE [ES | 


F, 6/4 


ND 
图 9.63 CARRER. TAAA Nam A Low 


从 及、B 和 C 和 天 始 的 可 达到 最 低 编号 项 点 为 1(A), 因为 它们 都 能 够 通过 树 的 边 到 D, 
RSH REY ES A. 我 们 可 以 通过 对 该 深度 优先 生成 树 执 4 r— Ua 2E LES 3 RR 
出 Lows 根据 low 的 定义 可 知 Low (vu) iE 

L. Num(v) 

2. BH EIL AC v, w) PARI Nem Co) 

3, 树 的 所 有 边 (w，w') 中 的 最 低 Low (ee) 
中 的 最 小 者 . 

第 -个 条 件 是 不 选取 边 , 第 二 种 方法 是 不 选取 树 的 边 而 是 选取 一 条 痛 辐 过， 第 三 种 方法 
则 是 选择 树 的 某 些 边 以 及 可 能 还 有 一 条 此 向 迪 : 第 三 种 方法 可 用 一 个 递归 调用 简明 地 描述 。 
AFROS ES vo 的 所 有 儿子 计算 出 Lose 值 后 才能 计算 Low(w), 因此 这 是 一 个 后 序 明 用 。 
ah FH AMICO, w), 我 们 只 要 检查 Num (0 Al Num ta 就 可 以 知道 它 是 树 的 一 条 这 还 是 
— A38 la b. 因此 ，Low (wv) 容 易 计算 ; fedi cie dli ”的 邻接 表 , 应 用 适当 的 法 则 ,并 记 住 
最 小 值 - 所 有 的 计算 化 费 OCELI + voj. 

剩 下 此 做 的 就 是 利用 这 些 信 息 找 出 所 有 的 制 点 根 是 割 点 当 且 仅 当 它 有 多 于 一 个 的 几 
Xo 因为 如 果 它 有 两 个 儿子 , 那么 删除 根 则 使 得 节点 相连 通 而 分 布 在 不 同 的 子 树 上 ; 如 采 根 7 
口 右 一 个 儿子 , 那么 除去 该 根 只 不 过 是 断 离 该 根 。 对 于 任何 其 他 顶点 v. CASES a 
CET LT: w (EIB Low (we Numo) 注意 , 这 个 条 件 在 根 处 总 是 满足 的 ; 内 此 , m i323) 


进行 特别 的 测试 。 

当 我 位 考查 算法 确定 的 割 点 . 即 CADE, 证 明 的 "( 当 ) 部 分 是 明显 的 . D 有 一 个 儿 
TE, H LowCEXZNum(D), 二 者 都 是 4. 因此 , 对 三 来 说 只 有 一 种 方法 到 达 刀 上面 的 任 
何 一 点 , 那 就 是 要 通过 D. 类 伏地 ，C 也 是 一 个 割 点 , 因为 Low(G)z2 Num (CC) s 为 了 证 明 
该 算法 正确 , 我 们 必须 证 明 论 断 的 only if*( 仅 当 ) 部 分 成 立 ( 即 , 它 找到 所 有 的 割 点 )。 我 们 把 
它 留 作 一 道 练习 。 作为 第 二 个 例子 , 我 们 指出 (图 9-64) 同 样 在 这 个 图 上 应 用 该 算法 在 顶 /i C 
开始 深度 优先 搜索 的 结果 ， 





图 9 64 在 如 开始 深度 优先 搜索 所 得 到 的 深度 优先 树 


最 后 , 我 们 给 出 盆 代 码 实现 该 算法 ; 为 使 程序 简单 设 数组 Visited [ ] (初始 化 为 false) . 
Num |. Low[ ] 和 Parent ] 为 全 局 变量 。 我 们 还 有 一 个 全 局 变量 叫做 Counter, NAIF 
历 编 号 Num[ RRL, 将 Counter 初始 化 为 下 通常 这 在 实践 中 不 是 一 个 好 的 程序 证 计 , 不过， 
包含 所 有 的 声明 和 传递 那些 额外 的 参数 将 会 模糊 程序 的 逻辑 结构 - 我 们 还 将 省 略 对 根 的 容易 
实现 的 测试 。 

正如 我 们 已 经 提 到 的 , 该 算法 可 以 通过 执行 :次 先 序 遍 历 计算 Num Te TFA 
计算 Low KEM, 第 二 趟 遍历 可 以 用 来 检验 哪些 顶点 满足 割 点 的 标准 - 然而 , Pur — eS 
是 一 种 浪费 。 第 一 趟 在 图 9-65 PRE: 


/* Assign Num and compute Parents */ 


void 
AssignNum( Vertex V ) 
{ 


Vertex W; 
Num V ] = Counter++; 


Visited[ V ] = True; 
for each W adjacent to V 


ifC IVisited[ W ] 2 
| 
Parent[ W ] = V; 
AssignNum( W ?; 
; 





9-65 ”对 顶点 的 Nam 赋值 的 例 程 ( 伪 代 码 】 


AS — BR PT pie Fa, 可 以 通过 图 9-66 中 的 代码 来 实现 , SR 8 行 处 理 一 个 
FERAL. 如果 w SEI v, ARARA ww 将 发 现 w PEI veu AAE- AXE BIS, 而 
只 是 ACAPELA RARA. BU, BRIA Low [| A Num LER Ree, 
正如 算法 指定 的 那样 。 





/* Assign Low; also check for articulation points */ 


vnid 
| Ássiünbowt Vertex V } 


| Vertex Wi; 
| f* 1*4 Low V ] = Num[ V ]; /* Rule 1 */ 
D ft pe for each W adjacent to V 
| 

| /* Pf ift Num W ) > Num V 13 /* Forward edge */ 
1 
| FU AFF AssignlLow{ W 3; 
l ff Sn, ift Low[ Wo] >= Num[ V ] ) 
i ft Br printf( "Xv is an articulation point", v 3; 
| f® yy Low[ V ] = Mint Low[ V }, Low[ W ] 3; /* Rule 3 */ 
} 
| else 

A Be if( Parent] V ] l= W) /* Back edge */ 


图 9-66 计算 Low FERET n BO CR COLE EH Fr ) 


RETNA- n Re SP 在 递归 调用 前 和 递归 调用 后 者 有 可 |， 
rm 


能 对 两 者 进行 处 理 , 图 9-67 中 的 过 程 将 两 个 例 程 AssignNum 和 AssignLow 结合 成 一 种 育 接 
的 方式 得 到 了 晴 数 FindArt。 




















void 
FindArt€ Vertex V j 
{ 


| Vertex W: 


| 
/* d*j Visited[ V ] = True; 
ft anf Low[ V ] = Num[ V ] = Counter++; /* Rule i ¥ 
/* 3*/ for each W adjacent to V 
1 
ft A*S ifC IVisited[ W 3 3 /* Forward edge */ 
i 
Q /* of Parent[ W ] = V; 
| A Ge FindAÁrt( W 3; 
f? ii ift bowl W ] >= Numi V J J 
f* Be printf( "Xv is an articulation point\n", v 2; 
A 9*7 Low[ V ] = Ming Low[ V J, Low[ W ] 2; /* Rule 3 uf 
} 
else 
f° 1d iff Parent[ V ] != Ww) /* Back edge +7 


Low[ v ] = Mint Low[ V 1, Num[ W j 5»: /* Rule 2 */ 


图 9.67 在 一 次 深度 优先 搜索 (忽略 对 根 的 检测 ) 中 对 割 点 的 检测 ( 伪 代 但 ) 


9.6.3 欧 拉 回路 
考虑 图 9-68 中 的 三 个 图 。 一 个 流行 的 游戏 是 用 钢笔 重 本 这 些 图 , 每 条 线 恰 好 画 一 次 。 在 


M6 $03 
到 图 的 时 候 钢笔 不 要 从 纸 上 离 开 : 作为 一 个 附加 的 问题 ， 雪 在 结束 男 图 时 , 使 钢笔 名 到 开始 
画图 时 的 起 点 上 。 沪 游戏 有 一 个 非常 简单 的 解法 . 如 果 你 想 尝 试 求解 该 问题 , 那么 现在 就 可 
以 试 -一 试 - 





K 9-68 =a BS 


SS AREA FARA PF AT Ch, 而 且 不 可 能 结 来 在 起 点 处 , 第 二 个 图 
"Eu. 它 的 终止 点 和 起 点 相同 , 但 是 , 第 三 个 图 在 游戏 的 限制 条 件 下 根本 画 不 出 来 . 

我 们 可 以 道 过 给 每 个 交点 指定 -- 个 项 点 而 把 这 个 问题 转化 成 图 论 问题 。 此 时 ， 图 的 近 可 
以 自然 的 方式 规定 ， 如 图 9-69, 


9.60 sip Hon 


将 问题 转化 之 后 ,我们 必须 在 图 中 找 出 一 条 路 径 , 使 得 该 路 径 对 图 的 每 条 边 怡 好 访问 一 
次 。 如 果 我 们 要 解决 “附加 的 问题 ", 那么 我 们 就 必须 找到 一 个 隐 , 该 圈 怡 好 经 过 每 条 边 一 次 。 
这 种 图 论 问题 在 1736 年 由 欧 拉 解 决 , 它 标志 着 图 论 的 诞生 。 根据 特定 问题 的 叙述 不 同 , 这 种 
问题 道 常 时 做 欧 拉 路 径 (Euler path， 有 了 时 称 欧 拉 环 游 Euler tour) 或 欧 拉 回路 (Euler cir- 
uity 问 题 。 虽 然 欧 拉 环 游 和 欧 拉 回 路 问题 稍 有 不 同 , 但 是 却 有 相同 的 基本 解 。 因此 , E - 
节 我 们 将 考虑 欧 拉 回路 问题 。 

能 通 做 的 第 一 个 观察 是 , 其 终点 必须 终止 在 起 点 上 的 欧 拉 回路 只 有 当 图 是 连通 的 并 朋 每 
As Ji BORE CRD, 边 的 条 数 } 是 偶数 时 才 有 可 能 存在 , 这 是 因为 ,在 欧 拉 回 路 中 ， —^- Yi cà & 
ORLA, 则 必然 有 过 离开 。 如 果 任 -顶点 o HUBER APER, BR ASE 上 我 们 早晚 将 会 达到 这 样 
_ .种 地 步 , 即 只 有 一 条 进入 o 的 边 尚 未 访问 到 , 若 沿 该 边 进入 ”点 ， 那么 我 们 只 能 停 存 顶 战 
*， 不 可 能 再 出 来 。 姐 果 怡 好 有 两 个 顶点 的 度 是 奇数 ,那么 当 我 们 从 一 个 奇数 度 的 顶点 出 受 
最 后 终止 在 另 一 个 奇数 度 的 项 点 时 ,仍然 有 可 能 得 到 一 个 欧 接 环 游 。 这 里 ， 欧 拉 环 游 是 必须 
访问 图 的 每 一 边 但 最 后 不 一 定 必须 回 到 起 点 的 路 径 。 如果 奇数 度 的 项 点 多 于 两 个 , EZ CE 
环 游 也 是 不 可 能 存在 的 。 

上 一 段 的 观察 给 我 们 提供 了 欧 拉 回路 在 在 的 一 个 必要 条 件 。 不 过 ， 它 并 未 告诉 我 们 满足 
该 性 质 的 所 有 的 连通 图 必然 有 一 个 欧 拉 回路 , 也 没有 指 导 我 们 如 何 找 出 欧 拉 回路 。 事实 上 ， 
这 个 必要 条 件 也 是 充分 的 - 就 是 说 ， 所 有 顶点 的 度 均 为 偶数 的 任何 连通 图 必然 有 了 欧 拉 回路 。 
不 仅 如 此 ， 我 们 还 可 以 以 线性 时 间 找 出 这 样 - :条 回路 - 

由 于 我 们 可 以 用 线性 时 间 检 测 这 个 充分 必要 条 件 ， 因此 可 以 假设 我 们 知道 存在 一 条 欧 拉 
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回路 ,此 时 ， 上 基本 算法 就 是 执行 - :次 次 度 优 先 搜索 。 有 大 量 “ 明 显 的 "解决 廊 案 但 是 却 都 行 不 
gH. 我 们 罗列 了 一 些 在 练习 中 。 

主要 问题 在 于 ， 我 们 可 能 只 访问 了 图 的 一 -部 分 而 提前 返回 到 起 点 . 如 果 从 起 点 出 发 的 所 
Su AS, 那么 图 中 就 会 有 的 部 分 注 历 不 到 . 最 容易 的 补救 方法 是 找 出 有 汕 林 访问 的 边 
的 路 径 上 的 第 一 个 项 点, 并 执行 男 外 一 -次 深度 优先 搜索 . 这 将 给 出 另外 一 个 回路 ,把 它 拼 接 
到 原来 的 回路 上 。 继续 该 过 程 自 到 所 有 的 边 邦 被 遍历 到 为 止 - 

作为 一 个 例子 , 考虑 图 9-70 中 的 图 , 容易 看 出 , RPA PRR. 设 从 顶点 5 开 
始 , 我 们 遍历 5、4、10、5, 此 时 我 们 已 无 路 可 走 , FETA ABA GBA A DIEI. 情况 如 图 9-71 
所 未， 





图 9-70 欧 拉 回 路 问题 的 图 





E] 9.71. 387 5, 4, 10. 5 后 剩 下 的 图 


此 时 ,我们 从 顶点 4 继续 进行 , 它 仍 然 还 有 没 用 到 的 边 。 SUR. MPR 4, 1. 3, 7, 
4. 11, 10, 7, 9, 3, 4。 如 果 我 们 把 这 条 路 径 革 接 到 前 面 的 路 径 5, 4, 10. 5 E, WARME 
到 一 条 新 的 路 径 5, 4, 1, 3, 7, 4, 11, 10, 7, 9, 3, 4, 10, 5. 

此 后 , 剩 下 的 图 表示 在 图 9-72 0, 注意 , 在 这 个 图 中 ， 所 有 的 顶点 的 度 必 然 都 是 偶数 ， 
因此 、 我 们 保证 能 够 找到 一 个 图 再 拼接 上 . 剩 下 的 图 可 能 不 中 连通 的 , 但 这 并 不 重要 。 路 径 
上 存 有 未 被 访问 的 过 的 下 一 个 顶点 是 3。 此 叶 可 能 的 回路 可 以 是 3，2，8，9，6，3s 当 拼 接 进 
来 之 后 , 我 们 得 到 路 径 5, 4, 1, 3, 2, 8. 9, 6, 3, 7, 4, 11, 10, 7, 9, 3, 4, 10, 5e 


9 





图 972 385035, 4, 1, 3. 7, 4, 11. 10. 7, 9. 3, 4. 10, 5 后 的 图 
简 下 的 图 在 图 9-73 中 , HEIR S E, AARET T DR ES JE 9, Y eH gg 9, 


E oF 
12, 10, 9。 当 把 它 拼接 到 当前 路 径 中 时 , 我 们 得 到 回路 5, 4, 1, 3, 2, 8, 9. 12, 10, 9, 6, 3, 7, 
4, ti, 10, 7, 9, 3, 4，]10, 5。 当 所 有 的 边 都 被 遍历 叶 , 算法 终 耻 ,我 们 得 到 一 个 欧 拉 思路 : 


© 
o © (5 G) 
Q > o (D 
Q3 


Ej 9.73. HERES 55,4, 1, 3, 2. 8. 9, 6. 3, 7, 4, 11, 10, 7. 9. 3, 4, 10. 5 Js] Pia 


为 合算 法 更 有 效 ， 必 须 使 用 适当 的 数据 结构 。 我 们 将 概述 想法 而 把 实现 方法 留 作 练习 。 
为 使 拼接 简单 ， 应 该 把 路 径 作 为 一 个 链表 保留 。 为 避免 车 复 拉 描 邻接 表 . UTR TREK 
我 们 必须 保留 一 个 指名 最 后 扫描 到 的 过 的 指针 。 当 拼接 进 一 个 路 径 时 , 必须 外 拼接 点 开始 提 
索 新 顶点 ,从 这 个 新 顶点 进行 下 一 轮 深度 优先 搜索 。 这 将 保证 在 整个 算法 期 间 对 顶点 搜索 阶 
段 所 进行 的 全 部 工作 量 为 O(|EE|1)。 使 用 适当 的 数据 结构 ,算法 的 运作 时 间 为 
OE! + [Vl 

— ^ AE2E AELTEL B5 I6] CR ES 93 PL nj SH PT RA BR 这 个 
问题 称 为 哈密 汞 顿 图 问题 {Hamiltonian cycle problem) ; 虽然 看 起 来 这 个 问题 似乎 差不多 和 和 欧 
拉 回 路 问题 一 样 , 但 是 , 对 它 却 没 有 已 知 的 有 效 算法 . 我 们 将 在 9.7 节 中 再 次 看 到 这 个 问题 . 
9.6.4 有 向 图 

利用 与 无 向 图 相同 的 思路 ,也 可 以 通过 深度 优先 搜索 以 线性 时 间 届 上 由 有 加 图 - QR AD 
是 强 连 通 的 ,那么 从 某 个 节点 开始 的 深度 优先 搜索 可 能 访问 不 了 所 有 的 节点 。 在 这 种 情况 下 
我 们 在 某 个 未 作 标 记 的 节点 处 开始 , 反复 执行 深度 优先 搜索 ,直到 所 有 的 节点 都 被 访问 到 ， 
作为 例子 ,考虑 图 9-74 FHASA. 








图 9-74 一 个 有 向 图 


我 们 在 项 点 B 任意 开始 深度 优先 搜索 。 它 访问 顶点 B, C. A, D, E RIF. Rii, fe 
个 未 访问 的 顶点 再 重新 开始 。 我 们 任意 地 选择 在 H 开始 , 访问 PRU. 最 后 , 在 G SOFAS 
它 是 最 后 一 个 需要 访问 的 顶点 。 对 应 的 深度 优先 搜索 树 如 图 9-75 中 所 不。 
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深度 优先 生成 森林 中 虚线 箭 法 是 UJÉ(Co, we, RPM we 在 考查 时 已 经 作 了 标记 。 让 无 
向 图 中 , 它们 总 是 一 些 背 向 边 , 但 是 我 们 可 以 看 到 , 存在 三 种 类 型 的 边 并 不 通 问 新 的 顶点 。 首 先 
dS aA, DMC, H) ATE RT (forward edee) 如 CC， 了 D) 和 (0 E), 它们 从 
树 的 一 个 节点 通 向 一 个 后 裔 . 最 后 就 是 一 些 交 义 边 ， 如 (下 ,中 和 和 (如, F), 它们 把 不 直接 相关 的 
两 个 树 节 点 连接 起 来 。 深度 优先 搜索 森林 一 般 通 过 把 一 些 子 节点 和 一 些 新 的 树 从 左 到 右 浴 加 到 
森林 中 形成 。 在 以 这 种 方式 构成 的 有 向 图 的 深度 优先 搜索 中 , 交叉 边 总 是 从 右 到 左 行进 的 。 

有 些 使 用 深度 优先 搜索 的 算法 需要 人 区别 非 树 边 的 三 种 类 型 。 当 进行 深度 优先 搜索 时 这 是 
容易 检验 的 , 我 们 把 它 留 作 一 道 练习 。 

PERE WEARER PARES EIA, DEW P: 一 个 有 同 留 是 无 
圈 图 当 且 仅 当 它 没有 普 向 边 。( 上 面 的 图 有 背 向 边 ， 因 此 它 不 是 无 圈 图 。) 读 者 可 能 还 记得 ， 
拓扑 排序 也 可 以 用 来 确定 一 个 图 是 舍 是 无 网 图 . 进行 拓扑 排序 的 另 一 种 方法 是 通过 深度 优 所 
牛 成 森林 的 后 序 澳 历 给 顶点 指定 拓扑 编号 N，N - 1, …, 1。 只 要 图 是 无 图 的 , 这 种 排序 就 是 
— Sit B a 
9.65 查找 强 分 支 

通过 执行 两 次 深度 优先 搜索 , 我 们 可 以 检测 一 个 有 向 图 是 否 是 强 连 通 的 , WR EDER 
连通 的 ,那么 我 们 实际 上 可 以 得 到 顶点 的 一 些 子 集 , 它们 到 其 自身 是 强 连通 的 . xx Urn ELA 
用 一 次 深度 优先 搜索 做 到 , 不 过 , 此 处 所 使 用 的 方法 理解 起 来 要 简单 得 多 .。 

首先 , 在 输入 的 图 G 上 执行 一 次 深度 优先 搜索 ,通过 对 深度 优先 生成 森林 的 后 序 遍 历 将 
G 的 顶点 编号 , 然后 再 把 G 的 所 有 的 边 反 向 , 形成 Ge 图 9-76 中 的 图 代表 图 9-74 所 示 的 图 


该 算法 通过 对 6, 执行 一 次 深度 优先 搜索 而 完成 ,总 蚌 在 编号 最 高 的 项 点 开始 一 次 新 的 
深度 优先 搜索 。 TE, 我们 在 顶点 G 开始 对 G, 的 深度 优先 搜索 ，G 的 编号 为 10, IEEE Ds 
不 通 问 任何 顶点 , 因此 下 一 次 搜索 在 H 点 开始 。 这 次 调用 访问 [和 J。 下 一 次 调用 仁 B SOT 
ILIA, CAF. 此 后 的 调用 是 Djs(DD) 及 最 终 调用 DAE) 结果 得 到 的 深度 优先 生成 
森林 如 图 9-77 PATA. 

在 该 深度 优先 生成 森林 中 的 每 棵 树 ( 如 果 完 全 忽略 所 有 的 非 树 边 , 那么 这 是 很 容易 看 出 
的 ) 形 成 一 个 强 连通 的 分 支 。 因此 ,对 于 我 们 的 例子 , 这 些 强 连 通 分 支 为 {G1, 1H, 1, JI. 
HB, A. C, Fi, IDI 和 MIE!, 

为 了 理解 该 算法 为 什么 成 立 , 首先 注意 到 ， 如 里 两 个 借 点 v 和 ww 都 在 同一 个 强 连通 分 文 
中 .那么 在 原 图 G 中 就 存在 从 v Elw 的 路 和 和 从 w Slo BE, A, 在 G, 中 也 存在 现 
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O77 C, 的 深度 优先 搜索 - BoA Ga HLT. 1B, A, C, ESL DIS EI 


人 在， 如果 两 个 顶点 oue 不 在 G, 的 同一 个 深度 优先 生成 树 中 . 那么 显然 它们 也 不 可 能 在 同 
一 个 强 连 通 分 文中 . 

为 了 证 明 该 算法 成 立 , 我 们 必须 指出 ， 姑 时 两 个 顶点 v fw 在 局, 的 同一 个 深度 优先 午 
成 树 中 , 那么 必然 存在 从 v Blu DREAM w Be 的 路 径 , 等 价 地 ， 我 们 可 以 证 明 , 如 果 x 
是 G, 包含 w 的 深度 优先 生成 树 的 根 , 那么 存在 -- 条 从 工 到 z MA v 到 > 的 路 径 。 对 w MH 
相同 的 推理 则 得 到 一 -条 从 xz 到 tw 和 从 xw Be 的 路 径 。 这 些 路 径 则 意味 善 那些 从 o£] o 和 从 
w 到 vw( 经 过 2 RE- 

HF ov Er EG, 的 深度 优先 生成 树 中 的 一 个 后 裔 , 内 此 存在 G, 中 一 条 从 工 到 %w 的 路 
9. 从 而 存在 中 一 条 从 Sle 的 路 径 . 此 外 , 由 于 x EUR. 因此 > 从 第 一 次 深度 优先 
REA ERM Eas. TE, 在 第 一 次 深度 优先 搜索 期 间 所 有 处 理 v 的 工作 都 在 z 的 工 
作 结 束 前 完成 。 既然 存 在 一 条 从 v Blo 的 路 径 , 因此 v 必然 是 x 在 G 的 生成 树 中 的 一 个 后 裔 
GW 将 在 x 之 后 结束 。 这 意味 着 GC 中 从 上 到 v 有 一 条 路 径 , 证 明 完成 : 


9.7 NEPE- 完全 性 介绍 


在 这 - 章 , 我 们 已 经 看 到 各 种 各 样 图 论 问题 的 解法 。 所 有 这 些 问题 都 有 一 个 多 项 式 运 行 
Fi ， 除 网 络 流 问题 外 , 运行 时 间或 考 是 线性 的 , 或 者 稍微 比 线性 多 一 些 (D(IE log ED). 
顺 醒 指出 ,我 们 还 提 到 ,对 于 某 些 问题 ,有些 变 化 似乎 比 原始 问题 要 困难 . 

器 忆 欧 拉 回 路 问题 , 它 朗 求 找 出 一 条 路 径 恰 好 经 过 每 条 边 一 次 ,该 问题 是 线性 时 间 要 蚀 
的 .哈密 尔 顿 图 问题 理 找 一 个 简单 轿 ,该 天 包含 每 一 个 项 点。 对 于 这 个 问题 ， 尚 不 知道 有 线 





对 于 有 向 图 的 单 发 点 无 权 最 短路 答 问 题 也 是 线性 时 间 可 解 的 , 但 对 应 的 最 长 简单 路 径 问 
ff Clongest-simple-path ) 83 4+ 14] £X EAN TH] PERE... 

jx Ao) BH Ae pp, ASB TEER fI Hi BUG SE . MIT pute d A HS OB € TE 
算法 , 而且 不 存在 保证 以 多 项 式 时 间 和 运行 的 已 知 算法 。 这 些 问 题 的 一 些 熟知 算法 对 于 其 些 输 
和 人 可 能 要 花费 指数 时 间 - 

在 这 一 节 , 我 们 将 简要 考查 这 种 问题 . 这 种 问题 是 相当 复 休 的, 因此 我 们 将 只 进行 快速 
和 非 正 式 的 探讨 。 这样- -来 . 我 们 的 讨论 可 能 (必然 地 ) 处 处 邦 或 多 或 少 因 不 准确 而 有 些 
BUER.. 

我 们 将 看 到 , 存在 大 基 重 要 的 问题 , 它们 在 复杂 性 上 大 体 是 等 价 的 。 这 些 问 题 形 成 一 个 
类 ,叫做 NP- 完 全 (NP-complete) 问 题 。 这 些 NP- 完全 问题 精确 的 复杂 度 仍然 需要 确定 并 且 在 
计算 机 理论 科学 方面 仍然 是 最 重要 的 开放 性 问题 , 要 么 所 有 这 些 问 题 有 和 多项式 时 间 解 法 , 要 
么 它们 都 设 有 多 项 式 时 间 解 法 : 

9.7.1 难 与 易 

在 给 问题 分 类 时 , 第 一 步 要 考虑 的 是 分 界 , 我 们 已经 看 到 , 许多 问题 可 以 用 线性 时 间 求 
解 . 我 们 还 看 到 某 些 O(logN) 的 运行 时 间 , 但 是 它们 要么 假定 已 做 某 些 预 处 理 ( 如 输入 数据 
已 读 人 或 数据 结构 已 建立 }, 要 么 出 现在 运算 实例 中 。 HN, Ged ROAR RIK, SAT 
两 个 数 M 和 NN AY, 花费 O(logN} 时 间 .. 由 于 这 西 个 数 分 别 由 log M 和 logN 个 二 进 制 位 组 
He, 因此 Ged 算法 实际 上 花费 的 时 间 对 于 输入 数据 的 量 或 大 小 而 言 是 线性 的 。 由 此 相知， 当 
我 们 度量 运行 时 了 间 时 ,我 们 将 把 运行 时 间 考 虑 成 输入 数据 的 量 的 图 数 。 一 般 说 来 , 我们 不 能 
期 组 运行 时 间 比 线性 串 好 。 

^j Ari, 确实 存在 某 些 真正 难 的 问题 . 这 些 问 题 是 如 此 的 难 ， 以 至 于 它们 不 可 能 解 出 : 
但 这 并 不 意味 着 只 能 发 出 叹息 , 期 待 天 才 来 求解 该 问题 。 正 如 实数 不 足以 表示 n <0 的 解 那 
Bt. 可 以 证 明 ， 计算 机 不 可 能 解决 碰巧 发 生 的 每 -个 问题 这 毕 “ 不 可 能 " 解 出 的 问题 是 做 不 
可 判定 问题 (undecidable problem). 

一 个 特殊 的 不 可 判定 问题 是 停机 问题 (halling problem) . 是 否 能 够 让 你 的 C 编译 器 拥有 
.个 附加 的 特性 ,， 即 不 仅 能 够 检查 语法 错误 , 是 且 还 能 够 检查 所 有 的 无 限 循 环 ? RT 
个 难 的 问题 , 但 是 我 们 或 许 期 望 , RULES BRP REE RE Be OT, 他 们 也 许 能 
4g ib] hax PP ee BAI A HESS o 

Vs] BIZ AR ar sg fa BEAR] AWWA, 这 样 一 个 程序 可 能 很 难 检查 它 目 已。 出 于 这 个 
WR, 有 时 这 些 问 题 叫做 是 素 归 不 可 判定 的 (rccursively undecidable) 5 

如 果 一 个 无 限 循环 检查 程序 能 够 号 出 ,那么 它 肯 定 可 以 用 于 自 检 。 此 时 我 们 可 以 制 震 一 
个 程序 叫做 LOOP, LOOP 把 一 个 程序 P 作为 输入 并 使 P 自身 运行 - SUR P É Eris 8E DR 
循环 ， 则 显示 短语 YES. 如 果 P 自身 运行 时 终止 了 , 那么 自然 要 做 的 事 是 显示 NO. RIN 
么 做 的 办 法 是 , 我 们 将 让 LOOP 进入 一 个 无 限 循 坏 : 

" LOOP 将 自身 作为 输入 时 会 发 生 什 么 呢 ? 要 么 LOOP 停止 , BARE IES 问题 在 于 ， 
[XM RIT ARE SSOP, 与 短 诸 "这 句 话 是 一 句 谎言 产生 的 予 盾 大 致 相同 ， 

根据 我 们 的 定义 , 如果 POPE, 则 LOOP(P) 进 入 一 个 无 限 循环 wI P = LOOP 
B. POE. 此 时 , 按照 LOOP 程序 . LOOP(P) 应 该 进入 一 个 无 限 循环 。 因此, 我 们 必须 


252 HOE 


一 .OC 一 
T HE 一 一 一 一 -一 一 -一 一 一 一 一 一 一 一 一 一 一 一 -一 ——— -一 -一 


让 LOOP(LOOP) 终 止 并 进 和 人 一 个 无 女 循 环 ， 显 然 这 是 不 可 能 的 - 另 一 方面 , 设 当 P = LOOP 
时 PP) 进 入 一 个 无 限 循 环 , 则 LOOP EAA, 面 我 们 得 到 同样 的 一 组 矛盾 。 因 此 , 我 
们 看 到 , 程序 LOOP 不 可 能 存在 。 

9.7.2 NP# 

NP ERE EXD A GY XE fe] BE. NP 代表 非 确定 型 多 项 式 时 间 {nondeterministie 
polynomial-time), 确定 型 机 髓 在 每 一 时 刻 部 在 执行 -- 条 指令 . 根据 这 条 指令 ,机 器 再 去 执行 
某 条 接 下 来 的 指令 , 这 是 惟一 确定 的 TU— BARRELS WARE, TE UI 
以 自由 进行 它 想 要 的 任意 的 选择 ,如 时 这些 后 面 的 步 又 中 有 一 条 导致 问题 的 解 , 那么 它 将 总 
是 选择 这 个 正确 的 步 台 ,因此 ， 非 确 定型 机 器 具有 非常 好 的 猜测 (优化 ) 能 力 : EE ER i 
奇怪 的 模型 ,因为 没有 人 能 够 构建 一 台 非 确定 型 计算 机 , 还 因为 这 台 机 器 是 对 标准 计算 机 的 
令 人 难以 置信 的 改进 (此 时 每 一 个 问题 都 变 成 易 解 的 了 )。 我 们 将 看 到 ， 非 确定 性 是 非 弟 有 用 
的 理论 结构 。 此 外 , 非 确定 性 也 不 像 人 们 想像 的 那么 强大 。 例如 , 即使 使 用 非 确 定性 , 不 可 判 
定 问题 仍然 还 是 不 可 判定 的 。 

恰 验 一 个 问题 是 否 属于 NP 的 简单 方法 是 用 “起 / 省 (yes/no) 问 题 "的 计 言 描述 该 问题 。 如 
果 我 们 存 多 项 式 时 间 内 能 够 证 明 一 个 问题 的 仁 意 “是 "的 实例 是 正确 的 , 那么 该 问题 属于 NP 
类, 我 们 不 必 担 心 “ 否 "的 实例 , 因为 程序 总 是 进行 正确 的 选 撑 。 因 此 , 对 于 哈密 尔 顿 网 问题 ， 
一 个 * 是 "的 实例 就 是 图 中 任意 一 个 包含 上 所 有 预 点 的 简单 的 回路 : 由 于 给 定 一 条 路 径 ， 和 验证 它 
是 否 真 的 是 哈密 尔 顿 图 是 一 件 简单 的 事情 ,因此 哈密 尔 顿 岁 问 题 属 于 NP。 诸如” 仔 在 长 度 大 
I K 的 简单 路 径 吗 ? "这样 的 适当 的 问题 也 可 能 容易 验 让 从 而 属于 ND.» 满足 这 条 人 性质 的 任何 
路 径 均 可 容易 地 检验 

由 于 解 本 身 显 然 提 供 了 验证 方法 , 因此 , NP 类 包括 所 有 具有 多 项 式 时 间 解 的 问题 。 人们 
会 祖 到 ,既然 验证 一 个 答案 要 比 经 过 计算 提出 一 个 答案 容易 得 多 , 因此 在 NP 中 就 会 存在 不 
具有 多 项 式 时 间 解 法 的 问题 。 这 样 的 问题 至 今 没 有 发 现 , TE, 非 确 定性 并 不 是 如 此 重要 的 
改进 是 完全 有 可 能 的 , 尽管 有 些 专家 很 可 能 不 这 么 认为 。 问 题 在 于 , 证 明 指 数 下 界 是 一 项 极 
其 困难 的 工作 。 我 们 曾 用 来 证 明 排 序 需 要 OON. logN) 次 比较 的 信息 理论 定 淹 方法 似乎 还 不 
足以 完成 这 样 的 工作 ,因为 决策 树 都 还 不 足够 大 . 

还 要 注意 , 不 是 所 有 的 可 判定 问题 都 属于 NP. SRE TOE AA R E R AA 
问题 .证 明 一 个 图 有 哈密 尔 顿 圈 是 相对 简单 的 一 件 事情 一 一 我 们 只 需 展 示 一 个 即 可 。 然而 部 
没有 人 知道 如 何以 多 项 式 时 间 证 明 一 个 图 没有 哈密 尔 顿 圈 : 似乎 人 们 只 能 校 举 所 有 的 网 并 且 
将 它们 一 个 一 个 地 验证 才 行 。 因 此 , 光 哈 密 尔 顿 轿 的 问题 不 知 属 不 属于 NP, 

9.7.3 所 P- 完 全 问题 

在 已 知 启 于 NP 的 所 有 问题 中 , 存在 一 个 子 集 ,叫做 NP- 完 全 (NP-complete) 问 题 , "EZ 
AY NP 中 景 难 的 间 题 。NP- 完 全 问题 有 一 个 性 质 , 妈 NP 中 的 任 -- 问 题 都 能 够 多 项 式 地 归 约 
成 NP- 完 全 问题 。 

一 个 问题 P, 可 以 归 约 成 问题 Ps 如 下 : BA- 个 映射 , BE Pi 85 4E fap Sc BA AB n] EL AER 
成 P. 的 一 个 实例 。 求 解 P;， 然后 将 答案 上 映射 回 原始 的 解答 。 作为 一 个 例子 ， 考虑 把 数 以 上 
进 制 输入 划一 只 计算 器 。 将 这 些 十 进 制 数 转化 成 二 进 制 数 , 所 有 的 计算 都 用 二 进 制 进行 : 然 
后 ， 再 把 最 后 答案 转变 成 十 进 制 显示 .. 对 于 可 多 项 式 地 归 约 成 Pa 的 P, 与 变换 相 联 系 的 所 
有 的 工作 必然 以 多 项 式 时 间 完 成 。 
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NP- 完 全 门 题 是 最 难 的 NP 问题 的 壤 因 在 于 , — NP- 完 全 的 问题 基本 土 可 以 用 作 NP 中 
任何 癌 题 的 子 程序 , 其 花费 只 不 过 是 多 项 式 的 开销 量 。 因此 ,如果 任意 NP 完全 问题 有 一 个 
多 项 式 时 间 解 , 那么 NP 中 的 每 -- 个 问题 必然 都 有 一 个 多 项 式 时 间 的 解 . 这 使 得 NP 完全 问 
题 是 所 有 NP 问题 中 最 难 的 问题 . 

设 我 们 有 一 个 NP- 完 全 问题 P|, 并 设 P. 已 知 属 于 ND. 再 进一步 假设 DP, 多 项 式 地 归 约 
成 Po. 使 得 我 们 可 以 通过 使 用 P2 求解 P 而 只 多 损耗 了 多 项 式 时 间 . 由 于 OP, 是 NP- 完 全 
ij, NP 中 的 每 一 个 问题 都 可 和 多项式 地 归 约 成 Pi., 应 几 多 项 式 的 封闭 性 , RTA BI, NP 中 的 
每 一 个 问题 均 可 多 项 式 地 归 约 成 Pl: 我 们 把 问题 妇 约 成 Pi ,然后 再 把 PI 归 约 成 P,, 因此 ， 
P, 是 NP- 完全 的 。 

作为 - :个 例子 ,， 设 我 们 已 经 知道 哈密 尔 顿 圈 问 题 是 NP- 冠 全 问题 - 巡回 售货员 (travcling 
salesman problem) 问 题 如 下 。 

巡回 上 售货员 问题 : 

给 定 一 完全 图 G = (V, E). CARARE K, 是 否 存 在 一 个 访问 所 有 顶 态 并 是 

BK 的 简单 图 ? 

这 个 何 题 不同 于 险 密 尔 顿 圈 问 题 , ee V CL V] 7 107 2 28389 TE n HA EI 
EL. 该 问题 有 很 多 重要 的 应 用 。 例如 ， 印刷 电路 板 需 要 穿 - 些 孔 使 得 芯片、 电阻 喝 以 及 其 他 
的 电子 元 件 可 以 置信 。 这 是 可 以 机 械 完成 的 。 穿 孔 是 快速 的 操作 ; 时 间 耗 费 在 给 穿孔 器 定位 
上 ， 定 位 所 需要 的 时 间 依 赖 于 从 孔 到 我 间 行 进 的 距离 。 由 于 我 们 希望 给 每 一 个 孔 位 穿孔 ( 然 
后 返回 到 开始 位 置 以 便 给 下 一 块 电路 板 穿孔 ), 并 将 钻头 移动 所 耗费 的 总 时 间 限 制 到 最 小 ， 
内 此 我 们 得 到 的 是 一 个 洲 回 售货员 问题 。 

洲 回 售货员 问题 是 NP- 完 全 的 。 容易 看 到 ,其 解 可 以 用 多 项 式 时 间 检 验 ， 当然 它 属 于 
NP. 为 了 证 明 它 旦 NP_ 完 全 的 ,我 们 可 党 项 式 地 将 哈密 尔 顿 圈 国 题 归 约 为 好 加 此 货 员 问 题 : 
为 此 , 构造 一 个 新 的 图 GC, GHG 有 相同 的 顶点 。 对 于 Gc BIST AIC, w). WR, 
w)€Gc. 那么 它 就 有 权 1， SN, 它 的 权 就 是 2。 我们 选取 并 = 1Vls ME 9-78. 





图 9-78 aS ys a aa E eH DT ED TL 


ANE. G5 e EORR BO GUB 1 BARA VAM e E BE ba BE fel 
BER 

WAC YES BBE NP 完全 的 问题 。 为 了 证 明 某 个 新 问题 是 NP- 完 全 的 ,必须 证 明 它 属 
NP, 然后 将 一 个 适当 的 NP- 元 iR E a ih UTA [a] E. 员 然 到 巡回 售货员 问题 的 变换 是 相当 
简单 的 , 但是, 大 部 分 变换 实际 上 却 症 相当 复杂 的 , 需要 某 些 复杂 的 构造 , AR ES 
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了 多 个 不 同 的 NP- 完 全 问题 之 后 才 考 虚实 际 提供 归 约 的 问题 , 由 于 我 们 只 关注 一 般 的 想法 ， 
央 此 也 就 不 再 讨论 更 多 的 变换 ; 42 5k DE EUER E TY S5 CEA. 

细心 的 读者 可 能 想 知 道 第 -- 个 NP- 完 全 问题 是 如 何 有 具体 地 被 证 明 是 NP- 完 全 的 。 出 十 证 
HH- :个 问题 是 NP- 完 全 的 , 需要 从 邮 外 一 个 NE- 完 全 问题 变换 到 人 它 ,， 因 此 必然 存在 革 个 NP- 
完全 问题 , 对 于 这 个 问题 上 述 思 路 行 不 遂 。 第 一 个 被 证 明 是 NP- 完 全 的 问题 是 可 满足 性 (xsat- 
isfiability 8] E , 这 个 可 满足 性 问题 把 -- 个 布尔 珍 达 式 作 为 输入 并 提问 中 否 该 表达 式 对 式 中 各 
变量 的 一 次 赋值 取 值 1。 

可 满足 性 当然 属于 NP. RAAB ART Ha RIAA HARARE A B (true), 
在 1971 年 , Cook 通过 直接 让 明 NP 四 的 所 有 问题 部 二 以 变换 成 可 满足 性 问题 而 让 明了 机 满 
足 性 问题 是 NP- 完 全 的 。 为 此 , 他 用 到 了 对 NP 中 每 -一 个 问题 都 已 知 的 事实 : NP 中 的 得 :个 
问题 都 可 以 用 一 台 非 确定 型 计算 机 在 多 项 式 时 间 内 求解 .计算 机 的 一 个 形 坏 化 的 模型 称 作 图 
RHL Turing machine). Cook 指出 这 人 台 机 器 的 动作 如 何 能 够 用 一 个 极其 复杂 但 仍然 是 多 项 式 
的 元 长 的 布尔 公式 来 模拟 。 该 布尔 公式 为 真 ， 当 且 仪 当 由 图 如 机 运行 的 程序 对 其 输入 科 到 一 
个 “是 "的 答案 . 

一 旦 可 满足 性 被 证 明 是 NP- 完 全 的 , 则 一 大 批 新 的 NE- 完 全 问题 ,包括 某 些 最 经 典 的 网 
题 ， 也 都 被 证 明 是 NP- 完 全 的 。 

除 可 满足 性 问题 外 , 我 们 已 经 考查 过 的 哈密 尔 顿 回路 问题 、 扩 回 和 售货员 和 问题、 最 长 路 径 
问题 都 是 NP- 完 全 问题 , 此 外 , 还 有 一 些 我 们 尚未 讨论 的 问题 如 装 箱 (bin packing) Fla. A 
(knapsack) 问 题 、 图 的 着 色 {graph coloring) 问题 以 及 图 (cliquc) 的 问题 者 是 普 名 的 NP-5£ 4 [n] 
题 。NP- 完 全 问题 相当 广泛 ,包括 来 自控 作 系 统 ( 调 度 和 安全)、 RHR B SUE. ER 
学 、 特 别 是 图 论 等 不 同 的 领域 的 问题 。 

总 结 

存 这 一 章 , 我 们 已经 看 到 图 如 何 用 米 给 出 许多 实际 和 牛 活 问题 的 模型 SEE ORE B PS 
是 非常 稀 玖 的 . 因此 , 注意 用 于 实现 这 些 图 的 数据 结构 很 下 要 。 

我 们 还 看 到 一 类 问题 , 它们 似乎 没有 有 有 效 的 解法 , 在 第 10 章 将 讨论 处 理 这 些 癌 题 的 茶 志 
方法 ， 
练习 

9.1 RER 9-79 的 一 个 拓扑 排序 . 
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QU HI— T RICE 9.1 节 中 拓扑 排 序 算法 的 队列 , 是否 得 到 不 问 的 排 子 ? 为 什么 - 
种 数据 结构 会 给 出 "更 好 "的 答案 ? 

编写 - -个 程序 执行 对 个 图 的 拓扑 排序 。 

使 用 标准 的 二 重 箱 坏 . - :个 邻接 赴 阵 仪 初始 化 就 需要 OOV]. Wte- -种 方法 
E 个 留存 鲜 在 一 个 邻接 算 阵 中 (使 香 测 试 一 条 过 是 和 否 存 村 花费 OCDE fe — X 
的 运行 时 间 。 

a. 找 出 图 9-80 中 图 的 A. i RIED Hop TE Gg d Ra Pre 

b. 找 出 图 9-80 PRY B S s AAT H fü IUE a d e a IBS f... 
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当 用 #4- 堆 实现 时 (6,5 12), Dijkstra 算法 最 坏 和 情形 的 运行 时 间 是 多 少 ? 

a. 给 出 在 有 -条 负 边 但 无 条 值 图 时 ,Dijkxtra 算法 得 到 错误 答案 的 例 于 - 

b. 证 明 , An fefe SUAE RR, 则 9.3.3 段 中 提出 的 赋 权 有 最短 路径 算法 是 
BEAT ao. JERKS Ae TAA OCEI- [VI 


jg—4 UT a ARE 1 ALE | RR, Dijkstra 算法 可 以 多 快 实现 ? 


9.10 a. 和 解释 如 何 修改 Dijkstra 算法 以 得 到 从 v Ble (97 pO Rn RA PRT SK 


9. Hl 
9.12 


9.13 


b. 解释 如 何 修改 Dijkstra 算法 使 得 如 果 存 在 多 于 一 条 从 v Blue 的 最 小 路 经 ,下 337] 
么 具有 最 少 边 数 的 路 径 将 被 选中 。 

找 出 图 9-79 中 的 网 络 的 最 大 流 。 

ibG = (v, E)B Be, s ECHR, 并 用 添加 一 个 项 点 上 以 及 从 GG 中 所 有 树 

nt 到 t 的 无 穷 容量 的 边 , 给 出 一 AER TUUS Mos 到 z HAG. 

CAE G = CV, pum V 划分 成 两 个 子 集 Vi 和 V2 FORM DU 

pns -个 子 集 中 的 图 

a. id REDE -个 岗 是 各 是 二 分 图 : 

b. 一 分 匹配 问题 是 找 出 FF 的 最 大 子 集 E 使 得 没有 顶点 含 在 多 于 一 条 的 边 中 。 mg 
9-81 中 所 示 的 是 四 条 边 的 一 个 匹配 {由 虚线 表示 )。 存在 一 个 五 条 迪 的 匹配 ， 它 
是 最 太 的 匹配 
指出 二 盆 匹 配 问题 如 何 能 够 用 于 解决 下 列 问题 : 我 们 有 一 组 教师 、 一 组 课程 ， 
以 及 每 信教 师 有 资格 教授 的 课程 此 。 如 果 没 有 教师 需要 教授 多 于 一 门 的 谋 称 ， 
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而 且 只 有 一 公教 师 可 以 教授 一 门 给 定 的 课程 , 那么 可 以 提供 井 汪 的 赣 程 的 最 
p WR EM 
c. 证 一 阿 络 流 问 题 可 以 用 来 解决 二 分 匹配 问题 . 





ABest - -个 二 分 图 


9.14 给 出 -个 算法 找 出 和 容许 最 大 流通 过 的 增长 通路 。 
9.15 a. 使 用 Prim Al Kruskal 两 种 算法 求 出 图 9-82 中 图 的 最 小 生成 酸 。 
b. 这 棵 最 小 生成 树 是 惟一 的 吗 ? 为什么， 





Pel 9-82 


9.16 如 果 存 在 一 些 负 的 边 权 , 那么 Prim SETS 3X Kruskal 算法 还 能 行 得 通 吗 ? 

9.17 证 明 立 个 顶点 的 图 可 以 有 RR Ba DE aR 

9.18 编写 一 个 程序 实现 Kruskal 算法 。 

9.19 ”如 果 一 个 图 的 所 有 边 的 权 都 在 1 和 |E| 之 间 , 那么 能 有 多 快 算出 最 小 生成 树 * 
9.20 ”给 出 一 个 算法 求解 最 大 生成 衬 . 这 比 求解 最 小 和 牛 成 树 更 难 吗 ? 

9.21 求 出 图 9.83 中 图 的 所 有 割 点 。 指 出 深度 优先 生成 树 和 每 个 项 点 的 Num 和 Low 的 值 。 
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9.22. 让 明 寻 找 割 点 的 算法 的 正确 性 。 
9.23 a. 给 出 一 种 算法 求 册 最 小 的 边 数 , 这 些 边 从 一 个 无 和 图 中 删除 后 应 使 所 得 的 图 是 
TAR. 
* b. 证 明 这 个 问题 对 有 向 图 是 NP- 完 全 的 。 
9.24 WFR: 在 一 个 有 问 图 的 深度 优先 生成 森林 中 所 有 的 释义 边 邦 址 从 右 到 左 的 . 
9.25 给 出 一 个 算法 以 雇 定 在 一 个 有 向 图 的 深度 优先 生成 森林 中 的 一 条 过 4a.、 wo) 
EM, Wmv, dc X IE BUS). 
9.26 找 出 图 984 的 图 中 的 强 连通 分 支 . 





iS] 9-%4 


9.27 编写 一 个 程序 以 技 出 一 个 有 向 图 的 强 连 通 分 支 。 

“9.28 给 出 一 个 算法 只 用 一 次 深度 优先 搜索 找 出 强 连通 分 支 来 。 使 用 类 人 于 双 连 通 性 算 
法 的 算法 。 

0.20 — AE G 的 双 连 通 分 支 {biconmnected component ) Je JE. 352 7f kV; -- 些 集合 的 划分 , 使 
得 每 个 边 集 所 形成 的 图 是 双 连 通 的 .修改 图 9-67 中 的 算法 ,使 能 找 出 双 连 通 分 文 
Ti EE ER o 

9,30” 设 我 们 对 一 个 无 向 图 进行 广度 优先 搜索 (breadth-first search) FFM Sr — PRI ALA 
A/S Cbreadth-first spanning tree). 证明 该 档 所 有 的 边 要 么 是 树 边 要 人 么 是 这 


X Xj. 
9 31 给 出 一 个 算法 在 一 无 向 (连通 ) 图 中 找 出 一 条 路 答 使 其 在 每 个 方向 上 恰好 通过 每 条 
边 一 次 ， 


9.32 a. 编写 一 个 程序 以 找 出 一 个 图 中 的 一 条 歼 拉 回路 (如 果 闻 在 的 证 )。 
b. 编写 一 个 程序 以 找 出 一 个 图 中 的 一 条 欧 拉 环 游 (如 果 存 在 的 证 )。 

9.33 ”有 向 图 中 的 欧 拉 回路 是 一 个 图 , 该 图 中 的 每 条 过 恰好 被 访问 一 次 。 

x a. 证明: 有 向 图 有 欧 拉 回路 当 且 仅 当 它 是 强 连通 的 并 且 每 个 顶点 的 人 度 等 于 出 
度 。 
sb. 给 出 一 个 算法 以 在 存在 网 拉 同 路 的 有 向 图 中 找 出 一 条 欧 拉 回 路 。 

9.34 a. 考 虚 欧 拉 回 路 问题 的 下 列 解法 : 假设 一 个 图 是 双 连 通 的 。 执 行 一 次 深度 优先 搜 
索 , 只 在 万 不 得 已 的 时 候 使 用 背 向 边 。 如 果 图 不 是 双 连 遂 的 ， 则 对 双 连 通 分 文 
递归 地 应 用 该 算法 。 这 个 算法 行 得 通 吗 ? 

bp_ 设 当 用 到 背 向 边 时 我 们 取 用 连接 到 最 近 祖 先 节点 的 背 向 边 , WARRE a 
111538? 
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9.35 FÉ (planar graph) 是 一 个 可 以 画 在 一 个 平面 上 而 其 任何 两 条 边 部 不 相交 的 图 。 
*a, WARE 9.85 中 的 两 个 图 都 不 是 平面 图 、 
b. 证 明 , 在 平 面 负 中 必然 存在 沫 个 项 点 与 最 多 不 超过 五 个 项 总 相连 
^o c. 证 明王 平面 网 中 KISI V:-6- 


on™ 


Ans 
i " 





图 9-85 


9.36 £8 Gnuluügraph) BERANE MS Ba] ap DUE SER (multiple edge MFA AS 
音 中 哪些 算法 对 于 多 重 网 不 用 修改 就 能 证 确 运行 9 对 其 余 的 算法 需要 进行 哪些 修 
p? 
9.37 G= (V, 上 上 ) 起 一 个 无 向 图 .使 用 深度 优先 搜索 设计 - -个 线 件 算法 , 措 G 的 每 
象 边 续 换 成 有 向 边 使 得 所 得 到 的 图 是 强 连通 的 ,或 者 确定 这 是 不 可 能 的 、 
9.38 给 你 一 把 棍 共 N 根 , 它们 以 某 种 结构 相互 委 斥 平 放 : BEREUR EY PR Pr e IE s 
每 个 端点 是 由 xX、y 和 和 < 坐标 确定 的 有 厅 一 元 组 iD E BEM. 一 根 要 仪 当 
甚 上当 有 要 放置 时 可 以 取 走 .: 
a. 解释 如 何 编 写 一 个 和 便 程 接收 两 根据 a 和 .并 报告 a ERED LR. b FA, 
MES bAK. (本 问 与 图 沦 毫 无 头 系 ) 
b. 给 出 一 个 算法 确定 是 否 能 够 取 走 所 有 的 棍 ， 如 果 能 , 部 么 提供 完成 这 项 工件 的 
HE Sat RAFF o 
9.39 团 问题 (clique problem) 可 以 叙述 如 下 : ATE AIA G = CV, FE) 和 一 个 整数 ， 
如 包含 一 个 最 少 有 并 个 顶点 的 完全 子 图 吗 ? 
顶点 覆盖 问题 {vertex cover problem) uf LRU An F: 给 定 IEG = YV, 
天 ) 和 一 个 整数 长 ，G EBLE — T T RV CV 使 得 1V x KOFH G 的 每 东边 
都 有 一 个 项 点 在 Y 中 ? 证 明 团 问题 可 以 多 项 式 地 归 约 成 项 点 覆 广 问题 ， 
9.40 设 哈 密 尔 屯 圈 问题 对 无 问 图 是 NP- 完 全 的 。 
a， 泪 明 啥 密 尔 顿 赔 问 题 对 有 向 图 是 NP- 完 全 的 。 
b. 证 明 简 单 无 权 最 长 路 从 问题 对 有 和 问 图 是 NP- 完 全 的 。 
9,41 棒球 卡 收藏 家 问题 (baseball card collector problem) 如下; EF H4 Pi, Pas s 





Bx Py DLT “MRK. 其 中 每 个 包 包 含 年度 棒球 卡 的 一 个 子 集 , 问 是 否 可 能 通过 
32, VERE K 个 包 而 搜集 到 所 有 的 棒球 卡 ? 证明 棒球 站 收藏 家 问题 是 NP- 完 全 的 。 
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第 10m 算法 设计 技巧 


迄今 我 们 已 经 涉及 到 一 些 算法 的 有 效 的 实现 。 我 们 看 到 , 当 一 个 等 法 给 定时 ,实际 的 数 
据 结构 无 须 指定 。 为 使 运行 时 间 尽 可 能 地 少 , 需要 由 编程 人 员 来 选择 适当 的 数据 结构 。 

椒 章 我 们 将 把 注意 力 从 算法 的 实 项 转向 算法 的 设计 、 到 现在 为 止 我 们 已 经 看 到 的 大 部 分 
算法 都 是 直接 的 和 简单 的 。 第 9 章 包 含 的 - - 些 算 法 要 深奥 得 多 , 有 些 需要 (在 有 些 情形 下 很 长 
的 ) 论 证 以 证 明 它 们 确实 是 正确 的 。 在 这 - RR. 我 们 将 集中 讨论 用 于 求解 问题 的 币 种 通常 类 
型 的 算法 . 对 于 许多 问题 , 很 可 能 这 些 方法 中 至 少 有 一 种 方法 是 可 以 解决 问题 的 特别 地 ， 
对 于 每 种 类 型 的 算法 我 们 将 

+ 看 到 - 般 的 处 理 方法 。 

区 查 几 个 例子 { 本章 末 尾 的 练习 题 提供 了 更 多 的 例子 )。 

-在 适当 的 地 方 概括 地 讨论 时 间 和 空间 复杂 性 。 


10.1 SRA 


Fe EE ARAA AEA A (greedy algorithm), TESB 9 章 我 们 已 经 看 
4i\— 4. RAR: Dijkstra BRK. Prim RPE A Kruskal A- 贪 焚 算 法 分 阶段 地 工作 - 在 每 一 
个 阶段 , 可 以 认为 所 作 决 定 是 好 的 ， 而 不 考虑 将 来 的 后 果 。 一 般 地 说 , 这 意味 蠢 选择 的 算 
个 局 部 的 最 优 。 这 种 “眼下 能 够 拿 到 的 就 拿 ” 的 策略 即 是 这 类 算法 和 名称 的 来 源 。 妆 算法 终止 
时 ,我 们 希望 局 部 最 优 就 是 全 局 最 优 。 和 如 果 是 这 样 的话 , 那么 算法 就 是 正确 的 ;否则 , 算法 行 
到 的 是 一 个 次 最 优 解 (suboptimal solution). WRR EGK £808] Ex HESSE, 那么 有 时 用 简单 的 宽 
栖 算 法 生成 近似 答案 , 而 不 是 使 用 一 般 说 来 产生 准确 答案 所 宕 要 的 复杂 算法 . 

有 几 个 现实 的 贪 禁 算法 的 例子 最 明显 的 足 找 零钱 问题 。 Jy p Ham ft NIRA ER. 我 
们 重复 地 配 发 最 大 额 货 币 。 于 荐 ,为 了 找 出 十 七 美元 六 十 -- 美 分 的 零钱 , 我们 拿 出 一 张 DX 
ce, KNEE, AK, 两 个 二 十 五 分 币 , 一 个 十 分 币 ， 以 及 一 个 分 币 , BA 
做 . 我 们 保证 使 用 最 少 的 钞票 和 硬币 。 这 个 算法 不 是 对 所 有 的 货币 系统 都 行 得 通 , 但 幸运 的 
i, 我 们 可 以 证 明 它 对 美国 货币 系统 是 正确 的 。 事 实 上 ,即使 允许 使 用 两 美元 钞 和 五 十 美 分 
币 该 算法 仍然 是 可 行 的 。 

交通 问题 有 一 个 例子 , 在 这 个 例子 中 , 进行 局 部 最 优选 择 不 总 是 行 得 通 的 ; 例如 , 在 过 
阿 察 的 某 些 交 通 高 峰 期 间 , 即使 一 些 主要 马路 看 起 来 空 功 功 的 , 你 最 好 还 是 把 车 停 在 这 些 街 
道 以 外 ,内 为 交通 将 会 洪 着 马路 阻 状 一 英里 长 ， (f tiat p ER EAS HR it o HE. AE EUR, 
yf REAR A SERRE, 最 好 是 朝 着 你 的 目的 地 相反 的 方向 临时 绕道 行 魏 。 

本 节 其 余部 分 , 我们 将 考查 几 个 使 用 贪 禁 算 法 的 应 用 。 第 一 个 应 用 中 简单 的 调度 问题 。 
闻 际 |， 所 有 的 调度 问题 或 者 是 NP- 完 全 的 {或 类 似 的 难度 ), 或 者 足 仿 禁 算法 可 解 的 。 第 二 
个 应 用 处 理 文件 压缩 , 它 是 计算 机 科学 最 早 的 成 果 之 一 。 最 后 , 我 们 将 介绍 - :个 贪 禁 近似 算 
法 的 例子 - 
10.1.1 一 个 简单 的 调度 问题 

分 有 作业 des oo dvo. ADO HDG TITTY AY fado s Exe 而 处 理 器 只 有 


们 将 假设 使 用 非 预 占 调度 (nonpreemptive scheduling): 一 旦 开始 一 个 作业 ， 就 必须 把 该 作业 
运行 到 完成 。 

作为 一 个 例子 , 设 我 们 有 四 个 作业 和 相关 的 运行 时 间 ， 恕 图 10-1 所 示 ; 一 个 可 能 的 调度 
在 图 10-2 PAH. Ay ;, FH 本 5 个 时 间 单 位 , ja 到 23 完成 , ja 到 26 而 j 到 36 SER, 所 以 
平均 完成 时 间 为 25. 一 个 更 好 的 调度 由 图 10-3 表示 , 它 产 生 的 平均 完成 时 间 为 17.75， 


0 15 23 Jé 36 


图 10-2. | HWSHE 








0 3 E 21 36 
图 10-3 2 号 调度 {最 优 ) 
图 10-3 给 出 的 调度 是 按照 最 短 的 作业 最 先进 行 来 安排 的 。 我 们 可以 让 明 这 将 总 会 产生 
一 个 最 优 的 调度 。 邻 调度 表 中 的 作业 是 元 ai, sie 第 一 个 作业 以 时 间 2, ER 第 二 个 作 
业 在 t, + 如 后 完成 而 第 三 个 作业 在 # + ,+ 如 后 完 成 。 出 此 我 们 看 到 ， 沪 调度 总 的 代价 上 
À 


I 
C= NN -R* Dt, (10.1) 
bei > x 
C=(N+1) 44 - Qk, (10.2) 
k-i k=] 


注意 , 在 方程 (10.2) 中 第 一 个 求 和 与 作业 的 排序 无 关 , 因此 只 右 第 二 个 求 和 影响 到 总 开 
销 。 设 在 一 个 排序 中 存在 + > y 使 得 上 <n 。 此 时 , HARHA, ZB j, RU, ,第 二 个 和 描 加 ， 
从 而 降低 了 总 的 代价 。 因 此 ,所 用 时 间 不 是 单调 非 减 的 任何 的 作业 调度 必然 龙 次 最 优 的 : 亚 
下 的 只 有 那些 其 作业 按照 最 小 运行 时 间 最 先 安排 的 调度 是 所 有 调度 方案 中 最 优 的 : 

这 个 结果 指出 为 什么 操作 系统 调度 程序 一 般 把 优先 权 赋 也 那些 更 短 的 作业 的 原因 。 
多 处 理 器 的 情况 

我 们 可 以 把 这 个 问题 扩展 到 多 个 处 理 器 的 情形 - 我们 还 是 有 作 呈 了 ,j2,… ay, 对 应 的 运 
行 时 间 分 别 为 五 ,二 vt ， 另 外 处 理 器 的 个 数 为 P。 不 失 一 般 人 性 , 我 们 将 假设 作业 是 有 序 
的 , 最 短 的 最 先 运 行 。 作 为 一 个 例子 , 设 P=3. 而 作业 则 如 图 10-4 Prom 

图 10-5 显示 一 个 最 优 的 安排 , 它 把 平均 完成 时 间 优 化 到 最 小 : 作业 ju. js 和 六 在 处 再 


器 1 上 运行 ,处理 器 2 人 处理 作业 j2, Js Ml pe. 而 处 理 器 3 运行 其 余 的 作业 总 的 完成 时 间 为 
(65, PHE = 18.33. 
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图 10-4 作业 和 时 间 图 10-5 多 处 理 器 情形 的 一 个 最 优 解 


解决 多 处 理 器 情形 的 算法 是 按 顺 序 开始 作业 ,处 理 器 之 间 轮 换 分 配 作业 。 个 难 让 明 祝 有 
哪个 其 他 的 顺序 能 够 若 得 更 好 ,虽然 处 理 器 个 数 P 能 够 整除 作业 数 N 时 存在 许多 最 优 的 照 
序 . FRAT OS «N/P, 把 从 jp+1 直 到 jo sop BERE T VEREOR RTI AERE SR D. 我 
们 可以 得 到 这 样 的 最 优 师 序 。 在 我 们 的 例子 中 , 图 10-6 指 出 了 第 二 个 最 优 解 。 





0 3 56 14 [5 20) 30 34 38 
图 10-6 dAbRERETULBUSR EU 


即使 P 不 恰好 整除 NN, 哪怕 所 有 的 作业 时 间 是 车 晃 的 , 也 还 是 有 许多 最 优 解 : 我 们 把 进 
p NE fr ER TERR 2] o 
将 最 后 完成 时 间 最 小 化 

在 本 小 节 最 后 , 考 虚 一 个 非常 类 似 的 问题 。 假设 我 们 只 关注 最 后 的 作业 的 结束 时 间 。 在 
上 面 的 两 个 例子 中 , 它们 的 完成 时 间 分 别 是 40 和 38。 图 10-7 指出 最 小 的 最 后 完成 时 间 丰 
34, 而 这 个 结果 显然 不 能 再 改进 了 ， 因为 每 一 个 处 理 器 都 在 一 直 忙 着 。 





0 35 9 1416 19 34 
图 10-7 将 最 后 完成 时 间 最 小 化 
虽然 这 个 调度 没有 最 小 平均 完成 时 间 , 但 是 它 有 个 优点 ， 即 整个 序 区 的 完成 时 间 和 更 于 
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如 果 同 -一 个 用 户 拥有 所 有 这 些 作 业 , 那么 该 调度 是 更 可 取 的 调度 方法 . Ra E n] n dE E H 
D, 但 是 这 个 新 间 题 实际 上 是 NP- 完 全 的 ; 它 怡 是 背包 癌 是 或 靶 箱 丫 题 的 另 一 种 专 述 方式 ,我 
们 后 面 在 本 节 还 将 遇 到 它 。 因 此 , 将 最 后 完成 时 间 最 小 化 显然 而 比 把 平均 完成 时 间 最 小 化 办 
难得 多 ， 
10.1.2 Huffman 编码 

在 这 一 节 , delle9IEmExAEBIE8JS PAR. 称 为 交 件 压缩 (file compression). 

标准 的 ASCII 字符 集 由 大 约 100 个 “可 打印 ”字符 ( 字符 RH me RH 
组 成 。 为 了 把 这 些 字符 区 分 开 来 , 需要 [log 10012 7. | "Qu o 





(00 10 30 
比特 (bn 一 二 进 制 位 )。 但 7 个 比特 可 以 表示 128 个 字 tr ry 
符 , 因此 ASCI 字符 还 可 以 再 加 上 一 些 其 他 的 “ 非 打 印 ” 0091 S | 
字符 。 我 们 加 上 第 8 个 比特 位 作为 奇偶 校 验 位 。 不 过 , 重 | pae mm BB | 


又 的 问题 在 于 , 如 果 字 符 集 的 大 小 是 C, 那么 在 标准 的 
编码 中 就 需要 站 log C 1 个 比特 。 

没 我 们 有 一 个 文件 ， 它 只 包 合 字 符 ae is O 图 10.8 使 用 HEAT 
加 上 一 些 空格 和 newline (换行 )。 进一步 设 该 文件 有 10 
个 a.、15 个 e、12 个 i.3 个 s, 4 个 t.13 个 空 本 以 及 一 个 newtine » 如 图 10-8 rate rz, 这 
个 文件 需要 174 个 比特 来 表示 , WAA 58 个 字符 , 而 每 个 字符 需 鉴 3 个 比特 。 

在 现实 当中 , 文件 可 能 是 相当 大 的 。 许多 非常 大 的 文件 是 菜 个 程序 的 输出 数据 ,而 在 使 
用 频率 最 大 和 最 小 的 字符 之 间 通 常 存在 很 大 的 差别 。 例如, 许多 巨大 的 文件 都 含有 很 多 很 多 
的 数字 、 空格 和 newline, 但 是 4 和 zz HB, 如 果 我 们 在 慢 速 的 电话 线 鞋 传输 这 些 信息 。 孝 
么 我 们 就 会 希望 减少 文件 的 大 小 。 还 有 , 由 于 实际 上 每 一 台 机 器 上 的 伐 盘 空间 都 荐 非常 珍 讽 
的 , 因此 人 们 就 会 想到 是 否 有 可 能 提供 一 种 更 好 的 编码 降低 总 的 所 需 比 特 数 ， 

答案 是 肯定 的 , 一 种 简单 的 策略 可 以 使 一 般 的 大 型 文件 节省 2596 ， 而 使 许多 大 型 的 数据 
文件 节省 多 达 50% ~60% 。 这 种 -- 般 的 策略 就 是 让 代码 的 长 度 从 字符 到 字符 是 变化 个 寺 的 ， 
同时 保证 经 营 出 现 的 字符 其 代码 短 ,。 注意 ,如果 所 有 的 字符 都 以 相同 的 频率 出 现 , 那么 要 市 
省 空间 是 不 可 能 的 。 

代表 字母 的 二 进 制 代 码 可 以 用 二 叉 树 米 表 示 , 如 图 10-9 Bras. 








图 10 9 树 中 原始 代码 的 表示 法 


图 10.9 中 的 树 只 在 类 时 上 有 数据 。 每 个 字符 通过 从 根 节点 开始 用 0 指示 左 分 支 用 1 指 
。。 示 咎 分 支 而 以 记录 路 径 的 方法 表示 出 来 。 例 如 ,s 通 过 从 根 向 左 走 ,然后 向 右 ， KURIER 
[9] 过 刘 ,二 是 它 被 编码 成 011。 这 种 数据 结构 有 时 叫做 rie 树 。 如 果 字 符 c, 在 深度 以 处 并 日 出 
52; TF IX, 那么 该 字符 代码 的 值 (cost) 就 等 于 .dijo 

可 以 利用 newline 是 仅 有 的 一 个 儿子 而 得 到 一 种 比 图 10-9 给 出 的 代码 此 好 的 代码 . 通 
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过 把 newline 符号 放 到 它 的 更 高 一 层 的 父 节 点 二 ,我 们 得 到 图 10-10 中 新 的 树 . RRR 
值 症 173, 但 该 值 仍然 远 役 有 达到 最 优 。 





各 10-10. 稍微 好 - - 些 的 树 


注意 , 图 10-19 中 的 树 是 一 棵 满 树 (fal tree): 所 有 的 节点 或 者 是 树叶 . SUPR AE TILE. 
-- 种 最 优 的 编码 将 总 具有 这 个 性 质 ， 否则 正如 我 们 已 经 看 到 的 ， BA TUDES H auf LA 
[移动 m. 

如 果 字 符 都 只 放 在 树叶 上 , 那么 任何 比特 序列 总 能 够 被 达 无 歧义 地 详 码 。 GLAD. Sio rb 
是 0100111100010110001000111. 0 不 是 字符 代码 , 01 由 不 足 字 符 代 码 , 但 010 是 1, TER 
-个 字符 是 i。 然 后 跟着 的 是 UL, 它 是 宇 符 s。 其 后 的 11 是 newline. 剩 下 的 代 公 分 唱 是 a. 
PE, t. i, e 和 newlines 因此 ， 这 些 字符 代码 的 长 度 是 否 不 同 并 不 要 紧 ， HERE ETE 
是 别 的 字符 代码 的 前 组 即 可 。 这 样 一 种 编码 叫做 前 缓 码 {character code), WR, ME- -TF 
符 放 在 非 树叶 节点 上 ， 那 就 不 再 能 够 保证 译 码 没有 二 义 性 - 

eGR, 我 们 看 到 ,基本 的 问题 在 于 找到 (如 上 上 定义 的 ) 总 价值 最 小 的 满 一 叉 树 ， 其 中 
所 训 的 学 符 部 位 于 树叶 上 . 图 10-11 中 的 树 显 示 该 例 简单 字母 表 的 最 优 树 。 从 图 10-12 可 以 
GH], 这 种 编码 只 用 了 146 个 比特 。 








a DOL 10 30 
* n 15 30 
E , » » A | 
5 00000 3 ji | 
i Un01 4 16 | 
spaces 11 13 26 
IN. - | rewhne OOOO 1 5 | 
mio RANAR 图 10-12 RAT 


注意 , 存在 许多 最 优 的 编码 。 这 些 编码 可 以 通过 交换 编码 树 中 的 儿子 节点 得 到 ,此 时 ， 
主要 的 未 解决 的 问题 是 如 何 构 造 编 码 树 。1952 E Huffman 给 出 了 一 个 算法 。 因此， 这 种 编码 
AB EE KS S (Huffman code). 
哈 夫 受 算 法 

本 小 节 我 们 将 假设 字符 的 个 数 为 CC。 哈 天 曼 算 法 (Huffman s algorithm) RJ ELA GE BH F: 
算法 对 一 个 由 树 组 成 的 森林 进行 。 一 棵 树 的 权 等 二 仑 的 树叶 的 频率 的 和 任意 选 到 最 小 权 的 
PERT, 和 To HERERO T, 和 Ts 为 子 树 的 新 树 ， 将 这 样 的 过 程 进行 C -1 次 。 在 算 
法 的 开始 , 存在 C 标 音节 点 树 一 一 每 个 字符 一 森 。 在 算法 结束 时 得 到 一 棵 树 , 这样 树 就 是 二 
(LR AK et B RAT . 
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我 们 通过 一 个 具体 例子 来 搞 清 算法 的 操作 . 图 10-13 RREA IRA: ERR TAR 
在 根 处 以 小 号 数 笠 标 出 。 将 两 覃 权 最 低 的 树 合并 到 一 起 , 由 此 建立 了 图 10- 14 中 的 麻 林 . 我 
们 将 新 的 根 命名 为 本 | ,这样 可 以 确切 无 误 地 表述 进一步 的 合并 。 图 中 我 们 令 s 是 左 儿 子 , 这 
E, 令 其 为 左 儿 子 还 是 右 儿 子 是 任意 的 :注意 可 以 使 用 哈 夫 坚 算 落 描 述 中 两 个 任意 性 。 新 树 
的 总 的 权 正 是 那些 老 树 的 权 的 和 ， 当 然 也 就 很 容易 计算 . 由 于 建立 新 畦 只 击 得 出 TET 
Ho, 建立 左 指 针 和 和 右 指针 并 把 权 记 录 下 来 、 因 此 创建 新 树 很 简单 。 
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图 10-13 RARER 


mai 
图 10-14 ARAIA EAS RE 


HEARRE. ef BURR BD. ORE TI 和 +， 然后 将 它们 合并 成 一 
HR. 树 根 在 T2, REBR, 见 图 10- 15。 BPE T2 Hla 合并 建立 T3, 其 权 为 10+ 8= 18， 
图 10- 16 显示 这 次 操作 的 结果 。 
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410-15 第 一次 台 放 后 的 了 哈 去 曼 算法 
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图 10-16. -KAHENE AA 


让 第 二 次 合并 完成 后 . BARR RR i SRR ARCU ou s 图 10- 17 指出 
这 两 棵 树 如 何 合并 成 根 在 TA 的 新 树 。 第 五 步 合并 根 为 和 了 3 的 树 ， 因为 这 两 棵 树 的 权 最 
Jy. 该 步 结果 如 图 10-18 所 示 。 
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图 10-17. SEEK etus S RE 
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图 10-18 第 五 次 合并 后 的 哈 大 曼 算 法 


最 后 , 将 两 个 剩 下 的 树 合 并 得 到 图 10-11 所 示 的 最 优 树 . 图 10-19 BRB A, 其 
RTE T6. 





图 10-19 最 后 一 次 合并 后 的 哈 夫 曼 算 法 


我 们 将 概述 哈 夫 学 算法 产生 最 优 代 码 的 证 明 思 路 ;详细 的 细节 将 留 作 练习 . HE. A 
让 法 不 难 证 明 树 必然 是 满 的 ,因为 我 们 已 经 看 到 一 棵 不 满 的 树 是 如 何 改进 成 满 估 的。 

其 次 , 我 们 必须 证 明 两 个 频率 最 小 的 子 符 a Aa p AEP TRUS UA CER RACAL BC uj 
LA [p] FÉ TO, BOREL RIBERA TER, BAIR oR ARERR A, 那么 必然 存在 
ET y 居 最 洪 的 节点 { 记 住 树 是 满 的 )。 SOR a 的 频率 小 于 Y. 那么 我 们 可 以 通过 交换 它们 在 
树 中 的 位 置 而 改进 权 的 值 。 

然后 我 们 可 以 论证 , 在 相同 深度 上 任意 两 个 节点 处 的 字符 可 以 交换 而 不 影响 最 优 性 : 这 
说明, 总 可 以 找到 一 棵 最 优 香 , 它 含 有 两 个 最 不 经 常 出 现 的 符号 作为 兄弟 ;因此 第 一 步 没有 
fi, MOL. 

证 明 可 以 通过 归纳 法 论证 完成 。 当 树 被 合并 时 ,我 们 认为 新 的 字符 集 是 在 根 上 的 郝 些 字 
符 于 是 , 在 我 们 的 例子 中 , 经 过 四 次 合并 以 后 , 我 们 可 以 把 字符 集 看 成 出 e 与 元 字符 了 3 和 
T4 组 成 . 这 屎 怕 是 证 明 最 微妙 的 部 分 ;我 们 要 求 读者 补足 所 有 的 细 姜 - 

该 算法 是 贪 禁 算法 的 原因 在 于 , 在 每 一 阶段 我 们 都 进行 一 次 合并 而 没有 进行 全 局 的 考 
IE, 我们 只 是 选择 两 棵 最 小 的 树 。 

妇 果 我 们 依 权 排序 将 这 些 符 保 存在 一 个 优先 队列 中 , IBA, 由 于 对 元 素 个 数 不 超 过 局 的 
做 先 队 列 和 将 进行 -一 次 BuildHeap, 2C - 2 1X. DeleteMin AI C - 2 次 Insert, 因此 运行 时 间 为 
OCC logC) , 使 用 一 个 链表 简单 实现 该 队列 将 给 出 一 个 OLC*) 算 法 。 优先 队列 实现 方法 的 园 
RAF C 有 多 大 TE ASCH 字符 集 的 典型 情况 下 ，C 是 足够 小 的 , 这 使 得 二 次 的 运行 时 间 
是 是 以 接受 的 。 在 这 样 的 应 用 中 ,实际 上 几乎 所 有 的 运行 时 间 都 将 花费 在 读 人 输入 文件 和 瑟 
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有 了 两 个 细节 必须 要 考虑 。 首 先 , 在 压缩 文件 的 开头 必须 要 传送 编码 傅 思 ,内 为 否则 将 不 
可 能 译 码 . OX FSB JURE I, DAS 10.4。 对 于 一 些小 文件 , 传送 编码 信息 表 的 代价 将 
超过 庄 缩 带 来 的 任何 可 能 的 节省 , 最 后 的 结果 很 可 能 是 文件 扩大 。 当然 , 这 可 以 检测 到 卫 原 
文件 可 原样 保留 。 对 于 大 型 文件 , 信息 表 的 大 小 是 无 其 紧要 的 。 

第 二 个 问题 是 ; 该 算法 是 一 个 两 越 扫描 算法 , 第 一 侦 搜 集 频 兴 数 据 , 第 一 侦 进行 编码 。 
TA, 对 于 处 理 天 现 文 件 的 程序 来 说 这 个 性 质 林 是 我 们 所 希望 的 。 某 坚 另 外 的 做 法 在 参考 文 
献 中 做 了 介绍 . 


10.1.3 近 羽 装 箱 问题 


在 这 一 节 , 我 们 将 考虑 某 些 装 箱 问 题 (bin packing problem) 的 算法 . 这 些 算法 将 运行 得 很 
th, 但 未 必 产 生 最 优 解 。 不过, 我 们 将 证 明 所 产生 的 解 卫 最 优 解 不 太 远 。 

设 给 定 N 项 物品 , 大 小 为 51，s2，…， sw， 所 有 的 大 小 者 
WE O«ssl. 问题 是 要 把 这 些 物品 装 到 最 小 数 自 的 箱子 中 
二 ,已 知 每 个 箱子 的 容量 是 1 个 单位 ; 作为 例子 , 图 10-20 
Bad 0.2, 0.5, 0.4, 0.7, 0.1, 0.3, 0.8 的 一 批 物 
hi Bx (te FA BY ATT 

有 黄种 版 本 的 装 箱 问题 。 第 一 种 是 联机 (on-line) 装 第 问 
题 。 在 这 种 问题 中 , 必须 将 每 一 件 物 品 放 人 一 个 箱子 之 石 才 
处 理 人 下 一 件 物 品 。 第 二 种 是 脱 机 toff-line) 装 箱 问 题 。 在 一 个 
脱 机 装 箱 算法 中 , 我 们 做 任何 事 都 需要 等 到 所 有 的 输入 数据 
全 被 读 和 信之 后 才 进 行 . 联机 算法 和 脱 机 算法 之 间 的 区 别 在 8.2 节 讨 论 过 。 





图 10-20 340.2. 0.5, 0.4, 
0.7, 0.1, 0.3. 0.8 的 最 优 装 逢 


联机 算法 


要 考虑 的 第 个 问题 足 ， 一 个 联机 算法 即使 在 允许 无 限 计算 的 情况 下 是 省 实际 上 总 能 给 
路 设 优 的 解答 。 我 们 知道 ， 即 使 允许 无 限 计算 ,联机 算法 也 必须 先 放 人 一 项 物品 然后 才能 处 
现下 一 件 物品 并 且 不 能 改变 决定 。 

为 了 证 明 联 机 算法 不 总 能 够 给 出 最 优 解 ,我 们 将 给 它 一 组 特别 难 的 数据 来 处 理 。 考 虑 山 
重量 为 二 - e 的 M 个 小 项 和 其 后 重量 为 方 + e 的 M 个 大 项 构成 的 序列 1, HP 0 e 0.01. 


显然 ， 如 果 我 们 在 每 个 箱子 中 放 一 个 小 项 青 放 一 个 大 项 ， 那么 这 些 项 物品 可 俯 放 入 到 M 个 
箱子 中 去 。 假 设 存在 一 个 最 优 联机 算法 A 可 以 进行 这 项 装 箱 工 作 。 考 虑 算法 A MPS D. 的 
操作 ， 该 序列 只 由 重量 为 了 -e IM T/T. Ip 是 可 以 装 人 [MI 个 箱子 中 的 -。 然而 ， 
由 于 A 对 序列 上 的 处 理 结果 必然 和 对 五 的 前 半 部 分 处 理 结果 相同 , 而 P, 前 半 部 分 的 输 人 
跟 5 的 输入 完全 相同 , 因此 A 将 把 每 一 项 物品 放 到 一 个 单独 的 箱子 内 。 这 说 明 A 将 使 用 的 
箱子 的 个 数 是 使 用 L 最 优 艇 的 防 倍 。 这 样 我 们 证 明了 ,对 于 联机 装 箱 癌 题 不 存在 最 优 径 法 ， 

上 面 的 论述 指出 , 联机 算法 从 不 知道 输入 何 时 会 结束 , 因此 它 提供 的 任何 性 能 保证 必 珊 
在 整 个 算法 的 每 一 时 刻 成 立 。 A FA FR | AAT CAT R , 那么 我 们 可 以 证 明 下 列 定 理 。 


定理 10.1 


存在 使 得 任意 联机 装 箱 算法 至 少 使 用 3 最 优 箱子 数 的 输入 。 

EAR : 

假设 情况 相反 ,为 简单 起 见 设 M 是 偶数 。 考 虑 任 一 运行 在 上 面 输入 序列 h 上 的 联机 算 
KA. 注意 , 该 序列 由 M 个 小 项 后 接 M 个 大 项 组 成 。 让 我 们 考虑 该 算法 在 处 理 第 M 项 
后 部 做 了 什么 . BA 已 经 用 了 6 个 箱子 . ERA, 箱子 的 最 优 个 数 是 M /2 ,因为 我 们 可 


以 在 每 个 箱子 里 放 人 两 件 物品 。 于 是 我 们 知道 、 根 据 我 们 的 低 于 人 的 性 能 保证 的 假设 ， 


2b M<, 


现在 考虑 在 所 有 的 物品 都 被 装 箱 后 算法 A 的 性 能 。 在 第 5 PAP ITP RRO AB FP 
每 箱 恰好 包含 一 项 物品 , 因为 所 有 小 物品 都 被 放 在 了 前 个 箱子 中 ,而 两 个 大 项 物品 又 次 不 
进 -个 箱子 中 去 。 由 于 前 5 个 第 子 每 箱 最 多 能 有 两 项 物品 , 而 其 余 的 箱子 每 箱 部 有 一 项 物 
品 , 内 此 我 们 看 到 , 将 2M 项 物品 装 箱 将 至 少 需 要 2M ~ b 个 箱子 。 但 2M 项 物品 可 以 用 M 


个 箱子 最 优 装 箱 ， 因 此 我 们 的 性 能 保障 保证 得 到 (2M - 6)/M C3 
第 一 个 不 等 式 意味 着 6/M< 分， 而 第 二 个 不 等 式 意味 着 64M> 生 ,这 是 矛盾 的 . 因此. 


3 

没有 联机 算法 能 够 保证 使 用 小 于 3 的 最 优 装 箱 数 完成 装 箱 。 

有 三 种 简单 算法 保证 所 用 的 箱子 数 不 多 于 二 售 的 最 优 装 箱 数 , 也 有 颇 多 更 为 复杂 的 算法 
能 够 得 到 更 好 的 结果 。 
下 项 适合 算法 

大福 最 简单 的 算法 就 属 下 项 适合 (next fi 算法 了 。 当 处 理 任何 一 项 物品 时 ,我 们 检查 看 
它 足 否 还 能 装 进 刚刚 装 进 物品 的 辣 -- 个 箱子 中 去 。 如 果 能 够 装 进去 , 那么 就 把 它 放 人 该 箱 
中 ;否则 ,就 开辟 一 个 新 的 箱子 。 这 个 算法 实现 起 来 出 奇 地 简单 ,而 且 还 以 线性 时 间 运 行 图 
10-21 显示 对 于 与 图 10-20 相 网 的 输入 所 得 到 的 效 箱 过 称 。 





图 10-2] 对 0.2, 0.5, 0.4, 0.7, 0.1, 0.3. 0.8 的 下 项 送 合算 法 


下 项 适合 算法 不 仅 编程 简单 ,而 用 它 的 最 坏 情形 的 行为 也 容易 分 析 。 

定理 10.2 

Ay M 是 将 一 列 物品 工装 箱 所 需 的 最 优 装 箱 数 , 则 下 项 适合 算法 所 用 箱 数 绝 不 超过 2M 
个 箱子 。 存在 一 些 顺 序 使 得 下 项 适合 算法 用 箱 2M -2 个 。 


证 明 : 


考虑 作 何 相 邻 的 两 个 箱子 B, MB, 1- B, MB,. 


E I0 x 


EAT a th ACN SMIRK F L, 


E EMEARI Bod DRR IREYA TNT OE MAMARE i 
么 我 们 看 到 , 顶 多 有 一 半 的 空间 闲置 , 因此 , 下 项 适合 算法 最 多 使 用 二 们 的 最 优 箱子 数 ，; 

为 说 明 这 个 界 是 精确 的 , 设 N 项 物品 , 0H : 是 奇数 时 ,物品 的 太 小 s =0.5 而 当 ;是 
偶数 时 s =2AN, WEN 可 被 4 整除 , 图 10-22 所 杰 的 最 优 装 箱 由 含有 2 件 大 小 为 0.5 的 
物品 的 N74 个 箱子 和 含有 NZ2 件 天 小 为 27N 物 邮 的 一 个 头子 组 成 ,总数 为 (N/A4) 4 1。 
图 10-23 表 示 下 项 适合 算法 使 用 NST. 因此 ,下 项 适合 算法 可 以 用 到 几乎 本 售 -+ 
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图 10-22 对 0.5, Z/N, 0.5. 24N, 0.5, 27N enn 的 最 优 装 箱 方法 
图 10-23 对 0.5, 27N, 0.5, 27N, 0.5, 27N, we AY PUA SRB 
首次 idein 


虽然 下 项 适合 算法 有 一 个 合理 的 性 能 保证 , 但 是 


, 它 的 效果 在 实践 中 却 很 其 ,内 为 在 不 


a E APR HUNG CRAT. EMIRIB I. 本 可 以 把 大 小 .3 的 物品 


BA B, 或 By 而 不 是 开 尽 一 个 新 箱子 。 
首次 适合 算法 (first fiO MERET HR 文 此 
箱子 但 把 新 的 一 项 物品 放 入 足 能 盛 下 它 的 第 一 个 
箱子 中 . 因此 , 只 有 当先 前 放置 物品 的 结果 已 经 没 
有 再 窜 下 当前 物品 余地 的 时 候 , RITAR -iA 
EE. FE 10-24 指出 对 我 们 的 标准 输入 进行 首次 适 
合算 法 的 装 箱 结果 。 
实现 首次 适合 算法 的 一 个 简单 方法 是 通过 亚 
FSA TP WEE, BHR 
OND 有 可 能 以 O(N log NEITA AG 





图 10-24 对 0.2,0.5,0.4.0.7.0.1, 
0.3, 0.8 的 首次 适合 装 箱 法 


全 算法 ;我 们 把 它 留 作 练习 。 

略 加 思索 读者 即 可 明白 ， 在任 一 时 刻 最 多 有 一 个 箱子 其 空 出 的 部 分 大 于 箱子 的 一 半 ， 内 
为 戎 有 第 二 个 这 样 的 箱子 , 则 它 装 的 物品 就 会 装 到 第 一 个 这 样 的 箱子 中 了 - 因此 我 们 可 以 立 
即 断 言 : 首次 适合 算法 保证 其 解 最 多 包含 最 优 装 箱 数 的 二 倍 。 

另 一 方面 , 我 们 在 证 明 下 项 适合 算法 性 能 的 界 时 所 用 到 的 最 坏 情况 对 首次 适合 算法 不 适 
i. 因此 ,人 们 可 能 要 问 : 是 否 能 够 证 明 更 好 的 界 呢 ? 答案 是 肯定 的 ,不 过 证 明 要 复杂 一 些 。 

定理 10.3 

令 M 是 将 一 列 物品 装 箱 所 需要 的 最 优 箱子 数 , 则 首次 适合 算法 使 用 的 箱子 数 绝 不 多 

于 | UM |. 存在 使 得 首次 适合 算法 使 用 局 (M - 1) 个 箱子 的 顺序 - 

WEBB: 

参阅 本 章 末 尾 的 参考 文献 

使 用 首次 适合 算法 得 出 的 结果 和 前 面 定理 指出 的 结果 几乎 一 样 差 的 例子 见 图 10-25 所 
示 。 图 中 的 输入 由 6M 个 大 小 为 十 e 的 项 后 跟 6M 个 大 小 为 计 +e BOSAL AE TOR OM 个 


大 小 为 十 + e 的 项 组 成 ，- -种 简单 的 装 箱 办 法 是 将 每 种 大 小 的 各 一 项 物品 装 到 一 个 箱子 中 
总 共 需 要 OM MAT. 如 用 首次 适合 算法 ， 则 需要 10M 个 箱子 。 





Bi By Bag OB aay B gate) >E oy 
图 10-25 首次 适合 算法 使 用 10M 个 而 不 是 5M 个 箱子 的 情形 


当 首次 适合 算法 对 大 量 其 大 小 均匀 分 布 在 0 和 1 之 间 的 物 总 进行 运算 时 , 经 验 络 乐 析出 ， [360 
首次 适合 算法 用 到 大 约 比 最 优 装 箱 方 法 多 2% 的 箱子 。 在 许多 情况 下 , 这 是 完全 可 以 接受 的 ， Pa 
最 佳 适合 算法 A 
我 们 将 要 考查 的 第 二 种 联机 策略 是 最 住 适合 算法 (best fit). BER EET WA 
所 发 现 的 第 一 个 能 够 容纳 它 的 箱子 , 而 是 放 到 所 有 箱子 中 能 够 容纳 它 的 最 满 的 箱子 中 。 典 型 
B5 3 4627 2: n E] 10-26 Pras. 
注意 , 大 小 为 0.3 BEL ERE Bz MERET 








By, 此 时 它 正好 把 Bs 填 满 。 由 于 我 们 现在 对 箱子 进 | o | u 
和 更 细致 的 选择 , 因此 入 们 可 能 认为 算法 性 能 保障 会 | Gje 
有 所 改善 。 但 是 情况 并 非 如 此 ， 因 为 总 的 说 来 坏 情形 是 | o2 | | 


相同 的 ， 最 佳 适合 算法 比 起 最 优 算 法 , 绝 不 会 坏 过 1.7 ^ B; B, E, 
信和 左右 , MEFE SA, 对 于 这 些 输入 该 算法 ( 几 图 10-26 0.2, 0.5. 0.4, 0.7, 0.1. 
乎 ;达到 这 个 界限 。 不 过 , 最 佳 适合 算法 编程 还 是 简单 0.3, 0.8 的 最 佳 适 合算 法 


Ae 8 10% 








的 , 特别 是 当 需 要 ON log N) 算 法 的 时 候 , 而 有 该 算法 对 随机 的 输入 确实 表现 得 更 好 
脱 机 算法 

如 果 我 们 能 够 观察 全 部 物品 以 后 再 算出 答案 , 那么 我 们 应 该 会 做 得 更 好 。 事 实 确实 如 
Wb. 由 于 我 们 通过 彻底 的 搜索 能 够 最 终 找到 最 优 装 箱 方法 , 因此 我 们 对 联机 情形 就 已 经 有 了 
一 个 理论 上 的 改进 。 

所 有 联机 算法 的 主要 问题 在 于 将 大 项 物品 装 箱 困难 ， PEN 
特别 是 当 它们 在 输入 的 晚期 出 现 的 时 候 ， 围 绕 这 个 问题 的 [i | S 
自然 方法 是 将 各 项 物品 排序 , 把 最 大 的 物品 放 在 最 先 。 此 | 
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时 我 们 可 以 应 用 首次 适合 算法 或 最 佳 适合 算法 , 分别 得 到 
首次 适合 遂 减 算法 {first fit decreasing) Hl 4E i£ &- ub i, Rx 
{best fir decreasing). 图 10-27 指出 在 我 们 的 例子 中 这 会 产 B, R. 
生 最 优 解 (尽管 看 一般 的 情形 下 显然 未 必 会 如 此 )。 | 

本 小 节 我 们 将 处 理 首 次 适合 递减 算法 。 对 于 最 佳 适 合 图 10-27 对 0.8, 0.7, 0.5, 0t 
遂 减 算法 ， 结 果 几 乎 是 .- 样 的 。 由 于 存在 物 唱 大 小 不 耳 异 03 02. 0L PROS SSH 
的 可 能 .因此 有 些 作 者 更 愿意 把 首次 适合 递减 算法 叫做 商 次 适 含 非 增 算 法 (first fit nonin- 
creasing). 我 们 将 沿用 原始 的 名 称 。 不 失 一 般 性 , 我 们 还 要 假设 输入 数据 已 经 根据 大 小 排序 。 

我 们 能 够 做 的 第 一 个 评注 是 , 首次 适合 算法 便 用 10M 个 而 不 是 OM 个 箱子 的 坏 情 形 在 

品 项 被 排序 的 情况 下 不 会 再 发 生 。 我 们 将 证 明 , 如 果 一 种 最 优 装 箱 法 使 用 M 个 箱子 , 那么 
首次 适合 递减 算法 使 用 的 箱子 数 绝 不 想 过 (4M +1) /3。 

这 个 结果 依赖 于 两 项 观察 。 首先, 所 有 重量 大 于 -3 的 项 将 被 放 入 前 M 个 箱子 内 。 这 意味 
B. 在 外 加 的 箱子 中 所 有 各 项 的 重量 顶 多 是 a。 第 二 个 结论 是， 在 外 加 的 箱子 中 物品 的 项 数 
总 多 可 以 是 M - 3. 把 这 两 个 结果 结合 起 来 我 们 发 现 , 外 如 的 箱子 最 多 可 能 需要 [(M - D 3 
个。 现在 我 们 证 明 这 两 项 观察 结果 。 

引 理 10.1 

4 N 项 物品 的 输入 大 小 (以 递减 顺序 排序 ) 分 别 为 s1，s2，“…，sw， 并 设 最 优 装 箱 方 法 使 


用 M 个 箱子 。 那么 首次 适合 递 碱 算法 放 到 外 加 的 箱子 中 的 所 有 物品 的 大 小 最 多 为 
HERA : 
BS i 项 物品 是 放 人 第 M 1 1 个 箱子 中 的 第 一 个 物品 。 我 们 需要 证 明 enl s RINE 





反 证 法 证 明 这 个 结论 。 设 s> 了。 


和 


f I, 所 有 的 箱子 By; B5, Ug. By 每 个 最 多 只 LE PUI n o 
ZETE :— p 项 物品 被 放 和 一 一 个 箱子 后 但 第 i 项 物品 尚未 放 入 时 系统 的 状态 . Be 


在 我 们 想 要 证 明 ( 在 s; Di 的 假设 下 ) 前 M 个 箱子 排列 如 下 : 首先 是 厂 些 箱子 内 恰好 有 


—J in 然后 油 下 的 箱子 内 有 两 项 物品 。 
没有 两 个 箱子 B. ALB, 使 得 1<r< ym M, B, 有 两 山 而 卫 ， 有 一 项 ; 令 "A 和 rj 
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OC 一 CC 一 


B, PRRI m, ES y 是 B, PRIRA mo riyo 因为 xl 被 放 在 较 前 的 箱子 中 。 H 
据 类 似 的 推理 sse BE, zt zs: + sis 这 意味 着 s, 是 应 该 可 以 放 在 B, 中 的 。 根 据 我 


们 的 假设 ,这 是 不 可 能 的 因此 ,如 未 s; >, 那么 在 我 们 试图 处 理 s 时 ,这 样 安排 前 M 个 


箱子 ,使 得 前 7 个 箱子 和 名 装 一 个 物品 , 而 后 M- i ARTERA an. 

为 了 证 明 该 引 理 , 我 们 将 证 明 不 存在 将 所 有 物品 装 人 M 个 箱子 的 方法 , 这 和 引 理 的 假 
GUY. 

显然 , susp cns s 中 使 用 任何 算法 部 没有 两 项 可 以 放 人 一 个 箱子 中 ， FUS AUR RE 
放 . 那么 首次 适合 算法 也 能 放 。 我 们 还 知道 , 首次 适合 算法 尚 林 把 大 小 为 $411， 5025 S, 
中 的 任 一 项 放 和 人 前 7 个 箱子 中 , 因此 它们 都 不 适合 。 这样 . ERTER, 特别 是 最 优 表 
箱 方法 中 , 必然 存在 ) 个 箱子 不 包含 这 些 项 。 由 此 可 知 , CADO seis sace cr. s BEDS 
然 包含 在 M-j 个 箱子 的 集合 中 , 考虑 到 前 面 的 讨论 , 于 是 这 些 项 的 总 数 为 20M — 0. 


注意 , UR ss, >$, 那么 只 要 证 明 s 没有 方法 放 人 这 M 个 箱子 当中 的 一 个 中 去 , AIN 


的 证 明 也 就 完成 了 。 事实 上 , 显然 它 不 能 放 入 这 j 个 箱子 中 去 , 因为 假如 能 放 人 , IARR - 


适合 算法 也 能 够 这 么 做 , 把 它 放 入 其 余 的 M -i 个 箱子 之 一 中 震 要 把 2CM - 7) +1 项 物品 分 
发 到 这 M i 个 箱子 中 。 因 此, 某 个 箱子 就 不 得 不 装 人 三 件 物 操 ， 而 它们 中 的 每 一 件 部 大 于 


l, gi, 这 是 不 可 能 的 。 
这 与 所 有 大 小 的 物品 都 能 够 装 人 M 个 箱子 的 事实 矛盾 ,因此 开始 的 假设 肯定 是 不 正确 
的 ， 从 而 s; 


引 理 10.2 

放 入 外 加 的 箱子 中 的 物品 的 个 数 最 多 是 M 一 1。 

证 明 : 

假设 放 入 外 加 的 箱子 中 的 物品 至 少 有 M 个 。 我 们 知道 > is M ,因为 所 有 的 物品 
都 可 装 人 M 个 箱子 。 设 对 于 UM, 箱子 B, 装 和 人 后 总 重 W)。 设 前 M 个 外 加 箱子 中 
的 物品 大 小 为 1，x2，…， am 此 时 ,由 于 前 M 个 箱子 中 的 项 加 上 前 M 个 外 加 箱子 中 
的 项 是 所 有 物品 的 一 个 子 集 ， TE 


YN. NW, 十 > p - Moy toan) 
现在 W, +2, >l, 8 BINAE s. IURE ARA B H, 因此 
82 Dism 


即 这 N 项 被 装 人 SUM ETEEN. 因此 . 最 和 多 只 能 有 M- ETAHI RIH Ain o 
定理 10.4 

^- M 是 将 物品 集 T 装 箱 所 需 的 最 优 箱子 数 ， 则 首次 适合 递减 算法 所 用 第 子 数 绝 不 超过 
(4M + 19/3. 


> PRECARA LERA M- AETHERE P CAPS T. BEA 20M 7 9 


1 
— 


364, 


证 明 : 

存在 M 一 1 项 外 加 的 箱子 中 的 物品 , 其 大 小 至多 为 也 HUC, 最 多 可 能 存在 [(M -1)/3] 个 

其 余 的 第 子 . 从 而 . 由 首次 适合 递减 算法 使 用 的 箱子 总 数 最 多 为 [ (4M — DAUM * 0/73, 
HEREDES, 对 于 首次 适合 递减 算法 和 下 项 适合 递减 算法 , BARK PRB SHOR, 

定理 10.5 

4 M 是 将 物品 集 了 装 箱 所 需 的 最 优 箱子 数 , 则 首次 适合 递减 算法 所 用 箱子 数 绝 不 超过 

E M+4。 此外, 存在 使 得 首次 适合 递减 算法 用 到 LNM 个 箱子 的 序列 ， 

UE RR ; 

LR EER. 下 界 可 以 通过 下 述 序列 展示 : Je A) +e 的 6M TR. 

其 后 是 大 小 为 二 +2s 的 6M IR, f 下 来 是 二 +e 的 6M 项 ,最 后 是 大 小 为 1 - 2e 的 


[2M 项 物品 。 图 10-28 指出 最 优 装 箱 需 要 9M 个 箱子 , 而 首次 适合 递减 算法 需要 IM 
个 箱子 。 


Bi a 





BB Boma Eg By Boy Beuna >E amt iea OF i 
图 10-28 首次 道人 台 递 减 算 法 合用 1144 个 箱子 , 但 只 有 9M 158 TREI T RUBER B T 


在 实践 中 , 首次 适合 递减 算法 的 效果 非常 好 。 如 果 大 小 在 单位 区 间 均 悦 分 布 ， 那么 外 有 加 
的 箱子 的 期 望 个 数 为 日 (v M )。 装 箱 算法 是 简单 宽 丈 试探 算法 能 够 给 出 好 结果 的 -~ 个 好 
例子 。 


10.2 分 治 算法 


用 于 设计 算法 的 另 一 种 常用 技巧 为 分 治 {divide and conquer) FLIX - 分 治 算法 出 两 部 分 组 成 ; 

分 (divide); 递归 解决 较 小 的 问题 (当然 ,基本 情况 除外 )。 

34 (conquer): 然后 ， 从 子 问 题 的 解构 建 怕 问题 的 解 : 

传统 E, 在 让 文中 至 少 含有 商 个 递归 调用 的 例 程 岂 做 分 治 算法 , 而 正文 中 只 含 一 个 递归 
调用 的 例 程 不 是 分 治 算法 , 我 们 一 般 坚 持 子 问题 是 不 相交 的 { 即 基本 上 不 重 看)。 让 我 们 回顾 
森 书 涉及 到 的 其 些 递归 算法 。 

我 们 已 经 看 到 几 个 分 治 算法 。 在 2.4.3 节 我 们 见 过 最 太子 序列 和 问题 的 一 个 
OCN log N) 解 。 在 第 4 章 , 我 们 看 到 过 - - 些 线性 时 间 的 树 遍历 方法 。 在 第 7 RE, 我 们 见 过 分 
治 算法 的 经 典 例 子 ， 即 归并 排序 和 快速 排序 , 它们 在 最 坏 情 形 以 及 平均 情形 分 别 有 
OLN log. NOBEL) o 
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我 们 还 看 到 过 递归 算法 的 苦 十 例子 , 在 分 类 上 它们 很 可 能 不 算 作 分 治 算法 , 而 只 是 化 简 
$i— ^ BL, TE 1.3 节 , 我 们 看 到 - -个 简单 的 显示 一 个 数 的 例 程 : 在 第 2 章 , 我 们 使 
用 递归 执行 有 效 的 取 寡 运算 。 在 第 4 章 , 我 们 考察 了 二 又 查找 树 一 些 简 单 的 搜索 例 程 。 在 6.6 
节 , 我 们 见 过 用 于 合并 左 式 堆 的 简单 的 递归 在 7.7 节 给 出 了 一 个 花费 线性 平均 时 间 解 决 选 
择 问 题 的 算法 . 第 8 章 递 妇 地 写 出 了 不 由 交集 的 Find 操作 . 第 9 RAA Dijkstra 等 法 更 新 
找 于 最 短路 径 的 一 些 例 程 以 及 对 图 进行 深度 优先 搜索 的 其 他 过 程 。 这 些 算法 实际 上 都 不 是 分 
党 算法 ,内 为 只 进行 了 一 次 递归 调用 : 
我 们 在 2.4 WHR SPITE BE A AA AE, FRA SE eA BRIE 
但 它 的 效率 太 莽 了 , 因为 问题 实际 上 根本 没有 被 分 割 
在 这 一 节 , 我 们 将 看 划分 治 算法 更 多 的 范例 . 我 们 的 筝 一 个 应 用 是 计算 几何 中 的 问题 : 
给 定 平面 上 的 N 个 点 , 我 们 将 证 明 最 近 的 一 对 点 可 以 在 O(N log N) 时 间 找 到 。 本草 后 面 的 
一 些 练习 描述 了 计算 几何 中 男 外 一 些 问题 , 它们 可 以 由 分 治 算 法 求解 。 本 节 其 余部 分 证 明理 
论 上 一 些 极 其 有 趣 的 结果 - 我 们 提供 一 个 算法 以 O(N ) 最 坏 情形 时 间 解 决 选 择 问 题 , 我们 还 
要 证 明 可 以 用 o ONT) FEN 2 个 N- 比特 位 的 数 相 莱 并 以 o( CN RAER A TERE., DE 
的 是 ,虽然 这 些 算法 最 坏 情形 时 间 界 比 传统 算法 更 好 , 但 如 果 输 入 并 不 特别 巨大 , 则 扬 们 都 
并 不 实用 . 
10.2.1 分 治 算法 的 运行 时 间 
我 们 将 要 看 到 的 所 有 有 效 的 分 治 算法 部 是 把 问题 分 成 一 些 子 问题 , 每 个 子 问题 都 是 原 问 
题 的 -部 分 , 然后 进行 其 些 附 加 的 工作 以 算出 最 后 的 答案 。 作 为 一 个 例子 , 我 们 上书 经 春 到 归 
并 排序 对 两 个 问题 进行 运算 ,每 个 问题 均 为 原 问题 大 小 的 一 半 ， 然 后 使 用 OCN Sita UTE. 
由 此 得 到 运行 时 间 方 程 ( 带 有 适当 的 初始 条 件 ) 
T(N)22T(N/2) * OCN) 
Se es 7 章 看 到 ,该 方程 的 解法 为 O(N log N) 下 面 的 定理 可 以 用 来 确定 大 部 分 分 
治 算法 的 运行 时 间 。 
定理 10.6 
方程 TON)-aTUN/b) + GCN'ORURROS 
O(N% ) rab 
T(N) 240CNflogN) Fazi 
|OCN*) Bac 
Ral a321, b> i. 
TE AR : 
根据 第 7 章 归并 排序 的 分 析 , 我 们 将 假设 N o BELT. 可 令 N= 8". 此 I N= 
ore NE = Qnm ante = (G ARRE TO) 71, 并 忽略 BCN PAIR 
AS. WA 
Te") = aT (a!) + (eR) 
WERA aT BRAA., MEE 
rib") _ Tie") a (10.3) 





OB #10 











T (pty B T (p) p m-1 

qud T gea Cla (10.4) 

Tib™-2) Try wey 

amz ger Cla (10.3) 
Tibl}  T(b9) pl | 
gi 一 a0 + a (10.6) 


RIAKO. DAL ORAA P P2143 91 GRE B RE EIS, 等 号 左边 的 所 有 项 实 
际 上 与 等 号 右边 的 前 一 项 相 消 ， 由 此 得 到 





| ao; 
-| (10.8) 
10 
因此 | 
m p F 
507 T(N) = Tib?) ef (10.9) 


如 果 ap, NEA IH ASUNT: 1 的 几何 级 数 。 由 于 无 穷 级 数 的 和 收 敏 于 一 个 党 
数 , 因此 该 有 穷 级 数 也 以 一 个 常数 为 界 , 从 而 方程 (10.10) 成 立 : 
TIN) = Ola") = O(a!) = O(N Pe) (10.10) 
如 果 a 二 从 , 那么 和 中 的 每 一 项 均 为 1。 由 于 和 含有 1+ logwV 项 而 a = ^ 意味 着 boga = k, 
于 是 
T(N} = Ota" log, N) = O(N®8 log, N) = O(N* log, N) 
= O(N* logN) (10.11) 
BE., WE acb, PAZLAR PRTRÆEAF 1. HL 1.2.3 中 的 第 二 个 公式 成 立 。 
我 们 得 到 
T(N) = qra 1 = O(a"(b*lay") = OUB”) = O(N*) (10.12) 
(b*/a) — 1 
定理 的 最 后 一 种 情形 得 证 . 
作为 一 个 例 了 , 归并 排序 有 a-5-2R &-1. 第 二 神情 形成 并 ， 国 此 答案 为 O(N log N)。 
如 果 我 们 求解 三 个 问题 , 每 个 问题 都 是 原始 大 小 的 一 半 , 使 用 O(N) 的 附加 工作 将 解 联合 起 
X. 则 a=3, 5=2 而 =1。 此 处 情形 1 成 立 , 于 是 得 到 界 O(N) = OCNT TO, 求解 三 个 
于 大 小 的 问题 但 需要 OCN?) 了 作 以 合并 解 的 算法 将 需要 O(N?) 的 运行 时 间 , 因为 此 时 第 
三 种 情形 成 立 。 
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有 两 个 重要 的 情形 定理 10.6 没有 包括 ., 我 们 再 叙述 两 个 定理 , GWAR FAS. 定理 
10.7 推广 了 前 面 的 定理 。 

定理 10.7 
方程 TONO -aT(NZb) + GC N log? ND BIRA 

ONE) E ab 

T(N) - Jot Nog? IN) a=b 

Ot N*log?N ) Hach 
其 中 221, 5 >1 H p20., 
定理 10.8 


PUES $5 ia <1, 则 方程 TCN) = XE TaN) + OUN) RA TUN) =OCN). 
10.2.2 最 近 点 问题 


我 们 第 一 个 问题 的 输入 是 平面 上 的 点 列 PS WER pi 二 (ri, A pom (G2. yo), 那么 
p, 和 p> 间 的 欧 几 里 德 距 离 为 [(z 7 22)? + Qu — y21 ^. 我 们 需要 找 出 一 对 最 近 的 点 有 Se 
可 能 两 个 点 位 于 相同 的 位 置 ;在 这 种 情形 下 这 两 个 点 就 是 最 近 的 , 它们 的 距 高 为 零 。 

如 果 存 在 N 个 点 ,那么 就 存在 NON -1)/2 对 点 间 的 距离 。 我 们 可 以 检查 所 有 这 些 距 
离 , 得 到 一 个 很 短 的 程序 , 不 过 这 是 一 个 花费 O(N WERK. 由 于 这 种 方法 是 一 种 详尽 的 搜 
3&. 因此 我 们 应 该 期 望 做 得 更 好 一 些 。 

假设 平面 上 这 些 点 已 经 按照 z 的 坐标 排 过 序 , 最 差 也 只 不 过 在 最 后 的 时 间 民 上 仪 多 加 了 
O(N log NI) 而 已 。 由 于 将 证 明 整 个 算法 的 OON log NOH, 因此 从 复杂 度 的 观点 来 看 ,该 排 
序 基 本 上 疫 增加 时 间 消 耗 的 级 别 。 

图 10-29 画 出 一 个 小 的 样本 点 集 P 既然 这 些 点 已 按 z 坐标 排序 , 那么 我 们 就 可 以 画 一 
ZARIE, 把 点 集 分 成 两 半 ; Pp WM Pp. 这 做 起 来 当然 简单 . 现在 我 们 得 到 的 情形 几乎 和 
我 们 在 2.4.3 节 的 最 大 子 序列 和 问题 中 见 过 的 情形 完全 相同 。 最 近 的 一 对 点 或 者 都 在 Pi P, 
或 者 都 在 PrP, 或 者 一 个 在 P, 中 而 另 一 个 在 Pr "P. 证 我 们 把 这 三 个 距离 分 别 呀 做 dr. dg 
Al de. 图 10-30 显示 出 点 集 的 分 化 和 这 三 个 距离 。 


n a 


图 10-20 一 个 小 规模 的 点 集 图 10-30 被 分 成 忆 AP, PREP. 
At ir Rees 
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我 们 可 以 递归 地 计算 d, 和 ds。 本 问题 此 时 就 是 = 
计算 de. 由 于 我 们 想 要 一 个 O(N log 入) 的 解 ， 因此 
我 们 必须 能 够 仅仅 多 花 DCN) 的 附加 CHB do. A 
我 们 已 经 看 到， 如果 一 个 过 程 由 两 个 一 半 太 小 的 递归 | 
调用 和 附加 的 ON) 工作 组 成 , 那么 总 的 时 间 将 是 ol 8 
OCN log N), 

^ $-min(di, dg), 我 们 的 第 一 个 观察 结论 是 ， 
UB do 对 8 有 所 改进 ,那么 我 们 只 需 计 算 SG. S 
de 是 这 样 的 上 距离 ， 则 定义 de 的 两 个 点 必然 在 分 割 线 
多 6 距离 之 内 ;我 们 将 把 这 个 区 域 叫 做 一 条 带 {strip)。 
如 图 10-31 Sas, 这 个 观察 结果 限制 了 需要 著 虚 的 点 
的 个 数 ( 比 例 中 的 8= dg. 

有 两 种 方法 可 以 用 来 计算 does 对 于 均 名 分布 的 大 型 点 集 , 预计 位 于 该 带 中 的 所 的 个 数 足 
非常 少 的 。 SE E, 容易 论证 平均 只 有 ON ) 个 点 是 在 这 个 带 中 。 因此, RMON) 
时 间 对 这 些 点 进行 蛮 力 计算 。 图 10- 32 中 的 的 代码 实现 该 方法 ， 其 中 按照 C 语 天 的 约定 ， 反 
RI FERMA 0 HHR 





i 
， BN 








图 10-31 METK, uA 
对 于 de TRENERA 


/* Points are al! in the strip */ 


for( i = GO: 1 < NumPointsInStrip; i++ 3 
fort j = i + L; J < NumPointsInStrip; j++ ) 
if Dhati P, P) S é } 





A= Feel P P); 
1369 
my 图 10-32. min (6, d OBSS ZEE 
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在 最 坏 情形 下 , SUGAR TAB ABER APRN, ORT TAS RE DLE TERT lai 
行 。 我 们 可 以 用 下 列 的 观察 结果 改进 这 个 算法 : 确定 de ATAR y 坐标 差别 最 多 是 8. 合 
Wj, de 8. 设 带 中 的 点 按照 它们 的 y 坐标 排序 。 因 此 , 如 果 p, Alp, 的 ? BEKT’, AB 
么 我 们 可 以 继续 处 理 p; ;1 这 个 简单 的 修改 在 图 10-33 中 实现 。 


/* Points are all in the strip and sorted by y coordinate */ 


fort i = 0; i < NumPointsInStrip; i++ ) 
for( j= i+ 1; j < NumPointsInStrip; j++ 3 


if( P, and P,'s coordinates differ by more than à ) 
break; /* Go to next P,. */ 

else 

ifi Dit bo c) 
6 = Dsl, Pay 





图 10 33 min (4, dH i 


ix M Mh p pes ot Ls ES, APR pu. 在 pi Mp Hy 坐标 
相差 大 于 8 RGR AE for 循环 以 前 , 只 有 少数 的 点 p, 被 考查 。 例 如 , 图 10-34 on 
108 p. 只 有 两 个 点 pa 和 ps TÀ foe SPE 8 ZA BU ARDC RY. 

对 于 任意 的 点 b, 在 最 坏 的 情形 下 最 多 有 7 个 点 p, 被 考虑 。 这 是 因为 这 些 点 必定 沙 和 在 
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VE AK RACE RRSP OX 8 TRAR ARE AR RAE RU OX 6 方块 内 - AD 
面 , FR axe ARARNAR ELOA A. HRT P. 每 个 方块 包含 4 个 点 , 每 
个 角 上 上 一 个 点 - 这 些 点 中 有 一 个 是 pu. RELER T 7 个 点 要 考虑 。 最 坏 情 形 的 状况 见 10-35 


所 示 。 TER. AIR p SRI pe A RREI. 但 它们 可 以 是 不 局 的 点 。 对 于 实际 的 分 析 来 说 ， 
惟一 重要 的 是 Ax 24 的 矩形 区 域 中 的 点 的 个 数 为 口 ([ ,这 当然 很 清楚 。 








P P | Pm Paz 
do i 
T Left half (A x A) Right half (À x A) 
y 
&— B 863 Pra Pra Pio Pra 
图 10-34 在 第 二 个 for PAA 图 10-35 最 多 有 8 个 点 在 该 拭 形 中 
只 有 ps 和 ps REE 有 两 个 坐标 此 中 从 个 都 由 两 个 点 分 享 


因为 对 于 每 个 p, 最 多 有 了 个 点 要 考虑 , 所 以 计算 比 人 好 的 df Bond 6 E OCNO. 因此 ， 
苦于 两 个 一 半 大 小 的 递归 调用 加 上 联合 两 个 结果 的 线性 附加 工作 , 看 来 我 们 似 竺 对 最 近 点 间 
题 有 一 个 O(N log N) AB. 然而 , 我 们 还 没有 真 赴 得 到 O(N log NOBSRE. 

问题 在 了 于, 我 们 已 经 假设 这 些 点 按照 y 坐标 排序 是 现成 的 。 如 时 对 于 每 个 北山 调用 我 们 
都 执行 这 种 排序 ,那么 我 们 又 有 OON log N) 的 附加 工作 : 这 就 得 到 一 个 O(N log NRE. 
不 过 问题 还 不 全 这 么 糟 , 尤其 在 和 蛮 力 O(N?) 算 法 比较 的 时 候 。 然而 , 不 难 把 对 于 每 个 递归 
调用 的 工作 简化 到 OCN) ,从 而 保证 O(N log NOFA 

我 们 将 保留 两 个 表 。 一 个 是 按照 x 坐标 排序 的 点 的 表 , 而 另 一 个 是 按照 y SA RP 
K, 我 们 分 别称 这 两 个 表 为 P 和 Q. 这 两 个 表 可 以 通过 一 个 预 处 理 排序 步骤 花费 OUN log. N) 
得 到 ,因此 并 不 影响 时 间 界 。P 和 是 传递 给 左 半 部 分 递归 调用 的 参数 表 ,，Px Qs lète 
说 给 在 半 部 分 递归 调用 的 参数 表 .。 我 们 已 经 看 到 , P 很 容易 在 中 间 分 开 。 一 旦 分 割 线 已 知 ， 
我 们 依 序 转 到 Q. 把 每 一 个 元 素 放 人 相应 的 Q; BY Qn c 容易 看 出 ' Q; Fl Qe 将 E Sig y 
SARH, "4E US Fa EIN, 我 们 扫描 Q 表 并 删除 其 x 坐标 不 在 带 内 的 所 有 的 扩 。 此 时 Q 
只 含有 带 中 的 点 ， 而 这 些 点 保证 是 按照 它们 的 y 坐标 排序 的 。 

这 种 策略 保证 整个 算法 是 OCN log N) 的 ， 因为 只 执行 了 OCNY) 的 附加 工作 . 
10.2.3 选择 问题 ‘ 

沈 择 问题 (selection problem) 要 求 我 们 找 出 含 N 个 元 素 的 表 S 中 的 第 A UBICA. 
我 们 对 找 出 中 间 元 素 的 特殊 情况 有 着 特别 的 兴趣 , 这 种 情况 发 生 在 & =[ N72 Bm fi. 

在 第 1 章 、 第 6 章 和 第 7 章 我 们 已 经 看 到 过 选择 问题 的 开 个 解法 : 第 了 章 中 的 解法 用 到 
快速 排序 的 变 体 并 以 平均 时 间 OCN DIT. 事实 上 , EE Hoare 论述 快速 排序 的 原始 论文 中 
已 有 描述 .。 
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虽然 这 个 算法 以 线性 平均 时 间 运 行 , 但 是 它 有 一 个 DAN) 的 最 坏 情 况 。 通 过 把 元 素 排 
FE. 选择 可 以 容易 地 以 OON log NN) 最 坏 情 形 时 间 解 决 , A, RA A EE E RE 
以 O(N ) 最 坏 情 形 时 间 完 成 。 在 7.7.6 节 概 述 的 快速 选择 算法 在 实践 中 是 相当 有 效 的 ,内 此 
这 个 问题 主要 还 是 理论 于 的 问题 - 

我 们 知道 ,基本 的 算法 是 简单 递 遇 策略 。 设 N 大 于 截止 点 (eutoft point), 在 截止 点 后 苞 素 
将 进行 简单 的 排序 . o 是 选 出 的 一 个 元 素 , 叫做 枢纽 元 (pivot)。 其 余 的 邢 素 被 放 在 岗 个 集合 S 
AS. 中. S, 会 有 那些 不 大 于 v HUCK, 而 So 则 包含 那些 不 小 十 o 的 元 素 。 Ba, WR 
REIS, MBA S pR: 个 最 小 的 元 素 可 以 通过 递归 地 计算 Si 中 第 上 个 最 小 的 元 案 而 找 
到 。 如 巢 &= 1S +1， 则 枢纽 元 就 是 第 大 个 最 小 的 元 闵 。 AM. 在 S 中 的 第 个 最 小 的 元 系 
ES, pH- ISl- Debo. 这 个 算法 和 快速 排序 之 间 的 主要 区 别 在 十 , 这 里 要 
求解 的 只 有 一 个 子 问 题 而 不 是 两 个 子 问题 。 

为 了 得 到 一 个 线性 算法 , 我 们 必须 保证 子 问 题 只 是 原 问 题 的 一 部 分 , 而 不 仅仅 只 是 比 原 
问题 少 几 个 元 素 .。 当然 ,如 果 我 们 床 意 花费 一 些 时 间 查 找 的 话 , 那么 总 能 够 找到 这 样 - -个 元 
3x. 困难 的 问题 在 于 我 们 不 能 花费 太 多 的 时 间 了 寻找 枢纽 拒 。 

对 于 快速 排序 , 我 们 看 到 枢纽 元 一 种 好 的 选择 是 选取 三 个 元 素 并 原 它 们 的 中 项 , 这 就 产 
生 某 种 枢纽 元 不 太 坏 的 期 望 , 但 它 并 不 提供 一 种 保证 。 我 们 可 以 随机 选取 21 个 元 素 , 以 带 数 
时 间 将 它们 排序 , 用 第 11 个 最 大 的 元 素 作为 枢纽 元 , ASUS) BE aA OL. PAIN, SUE 
这 21 个 元 素 是 21 个 最 大 元 , 郑 么 枢纽 元 仍然 不 好 。 将 这 种 想法 扩展 , 我 们 可 以 使 用 真 到 
ONAN) EA, 用 堆 排序 以 DCN) 总 时 间 将 它们 排序 ， 从 统计 的 观点 看 几乎 肯定 得 到 
-个 好 的 枢纽 元 . 不 过 , 在 最 坏 情形 下 , 这 种 方法 行 不 道 ， 因为 我 们 可 能 选择 OCN /og 入 ) 个 
最 大 的 元 素 , 而 此 时 的 枢纽 元 则 是 第 LN — O(N AogN)] 个 最 太 的 元 素 , 这 不 是 N 的 一 个 常 
数 部 分 。 

然而 ,基本 想法 还 是 有 用 的 。 的确, 我 们 将 看 到 , 可 以 用 它 来 改进 快速 选择 所 进行 的 比 
较 的 期 望 次 数 。 但是， 为 得 到 一 个 好 的 最 坏 情形 , 关键 想法 是 再 用 一 个 向 接 层 - 我 们 不 是 从 
随 视 元 豆 的 样本 中 找 出 中 项 , 而 是 从 中 项 的 样本 中 找 出 中 项 。 

基本 的 枢纽 元 选择 算法 如 下 : 

1. 把 N 个 元 素 委 成 | NA 组 , 5 个 元 素 一 组 ,忽略 (最 多 4 个 ) 剩 余 的 元 素 。 

2. 找 出 每 组 的 中 项 , 得 到 1 NAS] 个 中 项 的 表 M., 

3. 求 出 M 的 中 项 , 将 其 作为 枢纽 元 v 返回 。 

我 们 将 用 术语“ 五 分 化 中 项 的 中 项 ” ( median-of-median-of-five partitioning) 38 3E [88 Hj. Sa 
给 出 的 枢纽 元 选择 法 则 的 快速 选择 算法 。 现 在 我 们 证 明 ,“ 五 分 化 中 项 的 中 项 ” 保证 每 个 递归 
子 问 题 的 大 小 最 多 是 原 问 题 的 大 约 70% 。 我 们 还 要 证 明 , 对 于 整个 选择 算法 , WALE 以 是 
ag RARE IH, LURE O(N) 的 运行 时 间 。 

现在 让 我 们 假设 N 可 以 四 5 整除, 因此 不 存在 多 余 的 元 素 . 再 设 NA APA ER, 这样 M 
就 包含 奇数 个 元 素 。 我 们 将 要 看 到 ,这 将 提供 茶 种 对 称 狂 。 因此 为 方便 起 岗 我 们 假设 入 为 
105 +5 的 形式 。 我 们 还 要 假设 所 有 的 元 素 都 是 互 异 的 。 实际 的 算法 必须 保证 能 够 处 理 该 假设 
不 成 立 的 情况 。 图 10-36 指出 当 N= 45 时 , 枢纽 元 如 何 能 够 选 出 。 

在 图 10-36 中 ,wv 代表 该 算法 选 出 作为 枢纽 元 的 元 素 。 由 于 v 是 9 个 元 素 的 中 项 , dude 
们 假设 所 有 元 素 互 异 ， 因 此 必然 存在 4 个 中 项 大 于 以 及 4 个 小 于 ve 我 们 分 别 用 上 MS X 


JE XH S 283 

示 这 些 中 项 。 考 虑 具有 一 个 大 中 项 { 工 型 ) 的 五 元 素 组 . BA Po F HRS PATI TCR EL 
大 于 组 中 的 另 两 个 元 素 . 我 们 将 令 WARIS SULA. 存在 一 些 已 知 大 于 一 个 大 中 项 的 元 
RB. AH, 工 代 表 那 些小 于 一 个 小 中 项 的 元 娄 , 存在 10 个 HURR: 具有 工 型 中 项 的 
每 组 中 有 了 两 个 ,wv AEA PRT. 类似 地 , 存在 10 个 了 型 元 素 。 


5 无 素 的 排序 条 组 


~ 













wu 000000000 


图 10-36 枢纽 元 的 选择 


L 型 元 素 或 日 型 元 素 保证 大 于 vw, 而 S 型 元 素 或 了 型 元 素 保 证 小 于 wv。 于 是 在 我 们 的 问 
题 中 保证 有 14 SACHA 14 SICH. 因此 , 递归 调用 最 湖 可 以 对 45 一 14 一 1= 30 tX 
进行 - 

证 我 们 把 分 析 推 广 到 对 形 如 10&+5 的 一 般 的 N 的 情形 。 在 这 种 情况 下 , 存在 个 上 型 
FH Ake SS 型 元 素 , 存在 28+2 个 日 MR, 还 有 2k+2 个 个 型 元 素 , 内 此 , 有 3&+2 个 
元 素 保 证 大 于 v 以 及 3k +2 个 元 素 保 证 小 于 vw。 于 是 在 这 种 情况 下 递归 调用 最 多 可 以 包含 
1à 452 L 0.7N THRE. UN 不 是 10k 5 的 形式 , 类 似 的 论证 仍 可 进行 而 不 影响 基本 
结果 。 

剩 下 的 问题 是 确定 得 到 枢纽 元 的 送行 时 间 的 界 。 有 两 个 基本 的 步骤 。 我 们 可 以 以 常数 时 
ARE 5 元 素 的 中 项 。 pln, 不 难 用 8 次 比较 将 5 个 元 素 排序 。 我 们 必须 进行 LN 人 J 次 这 样 
的 运算 ,因此 这 一 步 花 费 OCN) 时 则 。 然后 我 们 必须 计算 LN 5] 元 素 组 的 中 项 。 明显 的 做 法 
是 将 该 组 排序 并 返回 中 间 的 元 素 。 但 这 需要 花费 O(LN/5] log LN/S D) = OCN log N) 的 时 
i]. 因此 不 能 这 么 做 , 解 次 方法 是 对 这 LN 75) 个 元 素 递 岂 调用 选择 算法 ， 

现存 对 基本 算法 的 描述 已 经 完成 。 如 果 想 有 一 个 实际 的 实现 方法 , 那么 还 有 某 些 纳 市 仍 
然 需要 填补 。 例 如 ,重复 元 必须 要 正确 地 处 理 , 该 算法 需要 截止 点 足够 大 以 确保 递归 调用 能 
能 进行 。 由 于 涉及 到 相当 大 量 的 系统 开销 , 而 且 该 算法 根本 不 实用 , AURIA EHRE TE 
何 细节 ,即使 如 此 , 该 算法 从 理论 的 角度 来 看 仍然 是 一 种 突破 ,因为 其 运行 时 间 在 基 坏 情形 
下 是 线性 的 , 正如 下 面 的 定理 所 述 。 


定理 10.9 
使 用 “五 分 化 中 项 的 中 项 ”的 快速 选择 算法 的 运行 时 间 为 O(N )。 
证 明 : 


该 算法 由 大 小 为 0.7N 和 0.2N 的 两 个 递归 调用 以 及 线性 附加 工作 组成。 根据 定理 
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10.8, 其 运行 时 间 是 线性 的 。 
降低 比较 的 平均 次 数 
E 分 治 算法 还 可 以 用 来 降低 选择 算法 预计 所 需要 的 比较 次 数 。 让 我 们 看 一 个 具体 的 例子 - 
379 设 有 1000 个 数 的 集合 S 并 呈 归 寻找 其 中 第 100 个 最 小 的 数 X. 我们 选择 S 的 子 集 S', EH 
100 个 数组 成 。 我 们 期 望 多 的 值 在 大 小 上 类 似 于 S’ 的 第 10 个 最 小 的 数 , 尤其 是 S 的 第 5 个 
最 小 的 数 儿 平 肯定 小 于 X, mS 的 第 15 个 最 小 的 数 几 乎 肯定 大 于 X. 
出 - 般 地 ,从 N 个 元 素 选 取 s 个 元 素 的 样本 S'. S 8 dE SCC, 后 惫 我 们 将 选择 它 使 每 把 
该 过 程 所 用 的 平均 比较 次 数量 小 化 。 我 们 找 出 S' 中 第 (v1 = B/N -人 个 和 第 (oa = 有 AN + 8) 
个 最 小 的 元 素 。 几乎 可 以 肯定 S 中 的 第 个 最 小 元 素 将 落 在 vi 和 vo 之 间 , 因此 和希 给 我 们 的 
是 关于 28 个 元 素 的 选择 问题 , 第 点 个 最 小 元 素 不 落 在 这 个 范围 内 的 概率 很 低 ， 而 我 们 有 大 
HO TEE, 不过, 只 要 和 6 选择 得 好 , 根据 概率 论 的 定律 我 们 可 以 肯定 , 第 二 种 情形 对 
于 整体 工作 不 会 有 不 利 的 影响 。 
如 时 进行 分 析 ， 那么 我 们 就 会 发 现 , 车 = N log N 和 6 = N'^log ^N, 则 期 望 的 比 
较 次 数 为 N +k + ON Aog! N), 除 低 次 项 外 它 是 最 优 的 。 GIR k > N2, 那么 我 们 可 以 
考虑 查找 第 (NN - 衣 ) 个 最 大 元 素 的 对 称 问题 。) 
大 部 分 的 分 析 都 容易 进行 。 最 后 一 项 代表 进行 两 次 选择 以 确定 v, 和 o» 的 代价 。 COUR 
用 合理 聪明 的 策略 , 则 划分 的 平均 代价 等 于 N 加 上 在 S 中 的 期 望 阶 (expected rank), BI 
N+h+ OCN Z5), 如果 第 上 个 元 素 存 $' 中 出 现 , 那么 结束 算法 的 代价 等 于 对 S 进行 选择 
的 代价 , BLOGO, WRA k 个 最 小 元 素 不 在 S "中 出 现 ,那么 代价 就 是 O(N). RM., sMs 
己 经 被 选取 以 保证 这 种 情况 以 非常 低 的 概率 of17ZN) 发 生 ,， 因此 该 可 能 性 的 期 望 代价 是 ot1)， 
TON 越 来 越 大 时 趋向 于 0。 一 种 精确 的 计算 留 作 练习 10.21. 
这 个 分 析 指 出 ， 找 出 中 项 平均 大 约 需要 1.5N 次 比较 。 当 然 , 该 算法 为 计算 s GRAS 
xm. 这 在 一 些 机 器 上 可 能 使 该 算法 减 惕 速度 。 不 过 即使 是 这 样 , 经 验 已 经 证 明 ， #7 HE IE m 
空 现 , 则 该 算法 完全 能 够 比 得 上 第 7 章 中 人 快速 选择 实现 方法 。 
10.2.4 一 些 运 算 问题 的 理论 改进 
在 这 -一 节 我 们 描述 一 个 分 治 算法 , 该 算法 是 将 两 个 N ORE. 我 们 前 面 的 计算 模型 假 
设 乘法 是 以 常数 时 间 完 成 ,因为 乘 数 很 小 。 对 于 大 的 数 ， 这 个 假设 不 再 有 效 。 如 果 我 们 以 来 
数 的 大 小 来 衡 晨 乘法 , ABS GRAD FEE BIS ERE A Tal, 而 分 治 算法 则 以 亚 二 次 (sub- 
duadratic) 时 间 运 行 。 我 们 还 介绍 经 典 的 分 治 算法 ， 它 以 亚 立 方 时 间 将 两 个 N x N EER. 
整数 相 乘 
376: 设 我 们 想 要 将 两 个 N 位 数 X ALY FAR. AE x MY 恰好 有 一 个 是 负 的 , 那么 结果 器 是 
负 的 ;否则 结果 为 正 数 。 内 此 , 我 们 可 以 进行 这 种 检查 然后 假设 XX，Y 之 0。 几乎 每 一 个 人 在 
手 算 乘法 时 使 用 的 算法 都 需要 ONOKE, 这 是 因为 X 中 的 每 一 位 数字 都 要 被 了 的 每 一 
(BR HEA 
WE X= 61 438 521 而 Y 294736 407, 那么 XY =5 820 464 730 954 O47. ibi HEX H Y 
拆 成 两 半 , 分 别 由 最 高 几 位 和 景 低 凡 位 数学 组 成 。 此 时 ,Xr = 6143, Xk 8521, Y= 9473, 
Y,-6407. 我 们 还 有 外 一 XL10 + XR VAR Y-— Yr104 + Yk。 由 此 得 到 
XY = X,YL 10 + (XLYp + XeYL 10! + XrYR 
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注意 ,这 个 方程 由 4 次 乘法 组 成 , 即 XY, X Ys. XsY, 利 XRYe， 它们 每 -个 郁 是 原 


问题 大 小 的 一 六 (N72 数字 )。 用 10 和 10 和 作 乘 法 实际 就 是 添加 一 些 0, 这 及 共 乒 的 几 次 加 
法 只 是 添加 了 OCN}) 附 吉 的 工作 ,; 如 果 我 们 递 帆 地 使 用 该 算法 进行 这 4 项 乘法 ,在 一 个 适当 
的 基本 情形 下 停止 , 那么 我 们 得 到 递归 
TON)—-ATON Z2) - OCGCN) 
从 定理 10.6 RIDAR, TN) = OOCN-) ,因此 很 不 幸 我 们 没有 改进 这 个 算法 为 了 得 到 
-个 亚 二 次 的 算法 , 我 们 必须 合用 少 于 4 次 的 递归 调用 ， 基 甸 的 观察 结 则 中 
XLYr + XgyY, — (X; — Xp) CYg YL) + XLYL+ XRYR 

是 , 我 们 不 用 两 次 乘法 来 计算 (O^ 的 系数 ， 而 可 以 用 一 次 乘法 再 加 上 已 经 完成 的 两 次 

Fe ASE. 图 10-37 演示 如 何 只 需求 解 3 次 递归 子 问题 。 


i 


HAARE C 


58 192 639 TIN; 
54 594 047 T(NI: 








DD; 7 290 948 Tins) 


120 077 634 CAN: 
| 54 594 047 Fic Eg 
1 200 776 340 000 OIN) 


l 
5 819 263 900 000 000 OIN) | 


5 R20 464 730 934 047 OIN i 


图 10-37 分 治 算法 的 执行 情况 


XY r D1 ^OXkYR 





容易 看 到 现在 的 递归 方程 满足 
T(N) -3T(N72) + O(N) 

MARTHA TON) = ON) = O(N 79), SER GIA, RIMA — PTET 
况 ， 该 情况 可 以 无 须 递 妇 而 解决。 

当 两 个 数 都 星 一 位 数字 时 , 我 们 可 以 通过 查 表 进 行 乘法 : 基 有 一 个 乘 数 为 0、 则 我 们 返 四 
0 假如 我 们 在 实践 中 要 用 这 种 算法 ,那么 我 们 将 选择 对 机 器 最 方便 的 情况 作为 基本 情 次 

虽然 这 种 算法 比 标准 的 二 次 算法 有 更 好 的 渐进 性 能 , 但 是 它 却 很 少 使 用 , 因为 对 于 小 的 
N 开销 大 , 而 对 大 的 N 甚至 还 存在 更 好 的 一 些 算法 。 这 些 算法 也 广泛 利用 了 分 治 算法 。 
EERE 

_ .个 基本 的 数值 问题 是 两 个 矩阵 的 乘法 。 图 10-38 给 出 一 个 简单 的 O(N) 算法 计算 
C= AB. 其 中 A, B 和 C 均 为 N NIER. 该 算法 直接 来 自 于 乍 阵 乘 法 的 定义 ， 为 了 计算 
C, 我 们 计算 A 的 第 i 行 和 B 的 第 7 列 的 点 来 。 按照 通常 的 惯例 ,数组 下 标 均 从 0 开 如 。 
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/" Standard matrix multiplication */ 
A Arrays start at Ù */ 


void 
| MatrixMultiply£ Matrix A, Matrix B, Matrix C, int M ) 
| int 1, j. Kk; 
for( i 20; 1 < N; i++ } /* Initialization */ 
fort j= 0; j < Mj j++ ) 
€[ 3103] J = 0.0; 


for( i =O; i < N; i++ } 


for( j= 0; 3 < N; je } 
fort k = 0; k < Ny ke 3 
Cli JL ji] += ALi Ek 1 * BE k Jia]: 





图 10-38 简单 的 OC NOBIS 


E KHAO e S RE PEE D S HLE CN3) 的 。 然 市 , TE 20 M 60 年 代 末 Strassen 
7S. Rute T pk CN? BORER. Strassen BEA) SERE E RH 8E— TA a EX, 4 块 ， 如 图 
10.39 Bran. 此 时 容易 让 明 





»n M Br] = [ee e 


Ax, Arl Baii Cu Caa 


图 10-39 $E AB= C HRR 4 RR 


Cia 7AB t A2821 

CaF Aia Bi * Ai aoB2 

C21 = Áo Brit A222821 

C57 A21B1,2 * Ao2B2,2 
作为 -个 例子 ， 为 了 进行 滋 法 AB 





5 4 1 6][5 6 9 3] 
]12537)]4531 
mls. 2 vis 4 
3 5 613 1 4 1 


我 们 定义 下 列 8 个 N/2 x N/2WIBRE: 


3 4 [1 S P J -[? 3] 
一 一 一 B 一 
Aji b | A1, P 7 By 4 5 27], | 


DU sel ned sed 
Aul, ; Analg gj PIA [5 1 22 lad 


ent. 我们 可 以 进行 8 NOX NZ2 BREA 4 PNK N72 阶 和 矩阵 的 加 法 。 这 些 
加 法 花费 OUN2) 时 间 。 如 果 递 归 地 进行 矩阵 乘法 ,那么 运行 时 间 满 足 
T(N) -BT(UNZ2) + O(N7) 
从 定理 10.6 RURA TON) = OCN3), 内 此 我 们 没有 作出 改进 。 如 同 我 们 人 在 整数 来 法 
Bale), 我 们 必须 把 子 问题 的 个 数 简化 到 8 个 以 下 。Strassen 使 用 了 类 似 于 整数 乘法 分 治 算 
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法 的 -种 策略 并 指出 如 何 仔细 地 安排 计算 而 只 使 用 了 次 递归 调用 。 这 7 个 乘法 是 
M,-(A,52- As ;)(Bo + Bo) 
M;-(A,4,* A22) (B, + B22) 
M;-(GA, 41-7 Az) (Biat Bi,2) 
M,=(A, 11 A2) Boo 
Ms = Aj 4 (B4 5 B22) 
Ms; = A; s(Bs 7 Bry) 
M;-(A»4 +t À235) Bia 
一 日 执行 这 些 乘 法 ， 则 最 后 答案 可 以 通过 下 列 8 次 加 法 得 到 
C,; 7M, * V5- Mit Me 
C,;-M,* Ms 
Ca, = Mi + Mp 
C= Mo- M:t M; - Mj 
直接 验证 这 种 机 敏 的 安排 得 到 期 望 的 效果 。 现 在 运行 时 间 广 足 递 归 关 系 
T(N)-7TUN 72) + O(N?) 
这 个 递归 关系 的 解 为 T(N})= OCNPS) 2 O(N 3). 

如 往常 一 样 , 有 些 细 节 需 要 考虑 , 如 当 N 不 是 2 PARERE EDU, 不 过 还 是 有 些 根本 性 小 
kk. Strassen 算法 在 N 不 够 大 时 不 如 知 阵 直接 相 乘 , 它 也 不 能 推广 到 年 阵 是 稀 玖 ( 即 舍 有 
许多 的 0 元 素 ) 的 情况 , 而 且 它 还 不 容易 并 行 化 。 当 用 浮 点 数 运算 时 , 在 数值 上 它 不 如 经 典 的 
等 法 稳定 。 因此 , 它 只 有 有 限 的 适用 性 。 AM, 它 象征 着 重要 理论 的 里 程 眉 并 证 明了 上 ， IET 
机 科学 像 在 许多 其 他 领域 一 样 ， 即使 一 个 问题 看 似 具 有 固有 的 复杂 性 , 但 在 被 证 明 以 前 却 始 
终 不 可 定论 。 


10.3 动态 规划 


在 前 一 节 , 我 们 看 到 一 个 可 以 被 数学 上 递归 表示 的 问题 也 可 以 表示 成 一 个 递归 算法 , 在 
许多 情形 下 对 朴素 的 穷 举 搜索 得 到 显著 的 性 能 改进 。 

任何 数学 递归 公式 都 可 以 直接 翻译 成 递归 算法 . 但 是 基本 现实 是 编 详 器 常常 不 能 正确 对 
待 递归 算法 , 结果 导致 低 效 的 算法 。 当 我 们 怀疑 很 可 能 是 这 种 情况 时 ,我 们 必须 再 给 编译 涡 
提供 一 些 帮助 , 将 递归 算法 重新 写成 非 递归 算法 , 让 后 者 把 那些 子 问题 的 答案 系统 地 记录 秦 
-个 表 内 。 利用 这 种 方法 的 一 种 技巧 叫做 动态 规划 (dynamic programming } » 
10.3.1 H—^4 XI BA 

在 第 2 章 我 们 看 到 , HA Re EN. 回忆 图 10-40 Bs 
的 程序 的 运行 时 间 TON RAE TON) > T(N- 1)+T(N-2). 由 于 TCN) 作 为 斐 波 那 回 数 
满足 同样 的 递归 关系 并 具有 同样 的 初始 条 件 , 因此 ,事实 上 TN) RUSS RA 
速度 在 增长 从 而 是 指数 级 的 。 

另 一 方面 , 由 于 计算 Fw 所 需要 的 只 是 Fy. 1 和 Fy, 因此 我 们 只 需要 记录 最 近 算出 的 
两 个 斐 波 那 契 数 。 这 导 敏 图 10-41 中 的 O(N) RR. 
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| /*" Compute Fibonacci numbers as discussed in Chapter 1 */ 


int 
Fibt{ int N } 
{ 


return Fib( N- 13 + Fib( N- 2 3; 


| 
ü 


图 10-40 HRW PRR HERR 









int 
Fibonaccit int N 5 
{ 
int i, Last, NextToLast, Answer, 


| ift N <= 1) 

| return 1; 

‘ Last = NextToLast = 1; 

| fort i = 2; i <= N; de) 

| 
Answer = last + NextToLast; 
NEXtTOLaSt = Last; 

| Last = Answer: 


} 
return Answer; 
} 


10-41 计算 韭 波 那 架 数 的 线性 算法 


递归 算法 如 此 慢 的 原 下 在 于 算法 模仿 了 递归 .为 了 计算 Fs. 存在 一 个 对 Fw.1 利 人 a 
的 调用 . 然而 . 由 于 Fj 递归 地 对 PY M Py :进行 调用 ， 因此 存在 两 个 单独 的 计算 PN -a 
的 调用 。 如果 探 试 整个 算法 ,那么 我 们 可 以 发 现 ，F、; 被 计算 了 3 次 , Fv-s 计 算 了 5 次 .而 
E. A) E Blk. 等 等 。 如 图 10-42 Bras, 元 余 计算 的 增长 是 爆炸 性 的 。 如 果 编 译 占 的 递 妇 模 
拟 算法 查 是 能 够 保留 一 个 预先 算出 的 值 的 表 而 对 已 经 解 过 的 子 问题 不 再 进行 递归 调用 ,那么 
387 这 种 指数 式 的 爆炸 增长 就 可 以 避免 。 这 就 是 为 什么 图 10-41 中 的 程序 如 此 有 效 的 原因 。 


p CUM. 
^ Fd u 
RITE FP CH p "E FI “RO 
p^ Cn m CQ E ‘Fo Fl “FO 
Fl F0 


图 10-42 ”跟踪 斐 波 那 契 数 的 递归 计算 
作为 第 二 个 例子 ,我 们 看 到 第 7 章 中 如 何 求解 递归 关系 CON) = (2/N) J aC + 
N. PCO) = 1, 假设 我 们 想 要 检查 所 得 到 的 解 是 否 在 数值 上 是 正确 的 ， 此 时 我 们 可 以 浓 
R 10-43 中 的 简单 程序 米 计算 这 个 递归 问题 。 
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| double 
Evalt int N ) 
1 


int i; 
double Sum; 
iff N == D } 
return 1.0: 
else 
i 
Sum = 0.0; 
for( 7 = 0; 1 < N; 1++ 3 
Sum += Eval€ 1 5: 
return 2.0 * Sum / M + N; 


| 
| 
图 10-43 计算 CEN) = (2AN) CG) + N 的 值 的 递归 程序 


这 里 , 递归 调用 又 做 了 重复 性 的 工作 。 在 这 种 情况 下 ,运行 时 间 TONAL TON) = 
M. T(i) N ,因为 如 图 10-44 Prim, 对 于 从 10 39] N — 1 ABARAT (BRIN 238 
HRE, Sh OCNORUER WT AE Cc Ed 10-44 Bron B8 pr PRR BB?) 对 TON ) 求 
ERDER, 它 的 增长 是 指数 式 的 。 通过 使 用 一 个 表 , 我 们 得 到 几 10-45 中 的 程序 。 这 个 各 
序 避 免 了 宛 余 的 递归 调用 而 以 ONAT., 它 并 不 是 一 个 完美 的 程序 ,作为 练习 .你 楼 对 它 
做 些 简 单 修改 ,把 它 的 运行 时 间 简 化 到 O(N )。 


a 
CA———7 "d Sec 
c So "4 Me "4 Yo s 


cf tx a to to a to t to 
ÁN N N N 
cf cw o CO co 
o 


图 10-44 REAR Eval 中 的 递归 计算 


10.3.2 和 矩阵 乘法 的 顺序 安排 

He EU MEM A.B. CHD, A 的 维 数 = 50x10, B 的 维 数 = 10x40, C 的 维 数 = 
40x30, D 的 维 数 = 30x5。 虽 然 矩阵 乘法 运算 是 不 可 交换 的 , 但 是 它 是 可 结合 的 ， 这 就 音 
味 着 垂 阵 的 乘积 ABCD 可 以 以 任意 顺序 添加 括号 然后 再 计算 其 值 。 将 两 个 阶 数 分 别 为 px 9 
Fl x r WERTER, EH por 次 标量 乘法 。( 由 于 使 用 请 如 Strassen 算法 这 样 的 理论 上 
优越 的 算法 并 没有 明显 地 改变 我 们 要 考虑 的 问题 ， 因此 我 们 将 假设 这 个 性 能 的 界 . ) 那 么 , 计 
算 ABCD 需要 执行 的 二 个 矩阵 乘法 的 最 好 方式 是 什么 ? 

在 四 个 矩阵 的 情况 下 , 通过 穷 举 搜索 求解 这 个 问题 是 简单 的 ， AAA LAH ARK 
EHME. FR RIT Oo F : 

- (ACC BC)D)): 计算 BC 需要 10 x 40 x 30 = 12 000 KÆ. 计算 {BC)D Im (fs e 

12 000 次 乘法 计算 BC, 外 加 10 x 30x 5 = 1 500 次 乘法 ， 合计 13 500 RIE. SK 
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"^ double 
Evalf int M ) 
1 


int 3, j; 
double Sum, Answer; 
double *C; 


C = malloct sizeof¢ double } * ( M+ 131 X; 
ift € == NULL } 
FatalÉrror(i "Out of space!!!" »; 


€ it j+ } 
Sum a= C[ j J; 
C[ i } = 2.0 * Sum / 3 + d; 
} 


| Answer = C[ N ]; 
| freeft C }: 


return Answer; 
} 


图 10-45 使 用 -- 个 表 来 计算 CON) = 2/N SOG) + N BS48 





(A(B(CD))): 计算 CD 58 H 40 x 30x 526000 KREE, HA BC CD) B9B 865 36 000 
次 乘法 计算 CD, 外 可 10 x 40x 5=2 000 MRE, 合计 8000 IX 3€ E. SX CA CB 
(CD) ES AES E 8 000 次 乘法 计算 BCD), 外 加 50x 10x 552 500 MH, 总计 
10 5001 3E; 

(( AB)(CD)): 计算 CD 需要 40x30x5=6000 次 乘法 - 计算 AB 需要 50 x 10 x 40 
—20 000 IEE. 3RCCAB)( CD) M8 9E 6 000 次 乘法 计算 CD, 20 000 XX GT 
TE AB, 9i 50x 40 5-10 000 次 乘法 ,总 计 36 000 KEH. 

((CAB)C)D): 计算 AB 3538 50x 10 x 40 2 20 000 KE., TEE AB) C. BB 22 
20 000 次 乘法 计算 AB, 外 加 50 x 40 < 30 — 60 000 KEE, Fit 80 000 次 乘法 。 求 
( CAB) C) D) KBE 80 000 次 乘法 计算 (4B)C, 外 加 50 x 30x 577 500 REI, 
总 计 87 500 次 乘法 。 

(CLACBC)) D): 计算 BC 需要 10x 40 x 30 — 12 000 次 乘法 , 计算 A (BC) 的 值 需 要 
12 000 次 乘法 计算 BC, 外 加 SO x 10x 30= 15 000 VOIE, 合计 27 000 MACH. OK 
(( A(BC))D) 的 值 需要 27 000 次 乘法 计算 ABC), 外 加 50X30x5=7 500 KRH, 
总 计 34 500 KBE. 


上 面 的 计算 吉明 , 最 好 的 排列 顺序 方法 大 约 只 用 了 最 坏 的 排列 顺序 方法 的 九 分 之 一 的 厂 
法 次 数 。 因 此 ,进行 一 些 计算 来 确定 最 优 顺序 还 是 值得 的 。 REM, 一 些 明 显 的 贪 禁 算法 
[382 似乎 都 用 不 上 ,而且 可 能 的 顺序 的 个 数 增长 很 快 . 设 我 们 定义 了 CN) 是 顺序 的 个 数 。 此 时 ， 
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TO) =T)=1, T3)=2, ffi T(4) 2 5, 正如 我 们 刚刚 看 到 的 。 一 般 地 ， 
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^ ] 
T(N) = 2 TG) TON - i) 
为 此 , BERTA Ai, Assoc. An, Be RIRE A Av S AD CA; Ayan Axe 此 
Bf. A TCA) AOKI RAA r ADHA T(N- DRIETAL 14 mo An). 因此 .对 
于 每 个 可 能 的 i 存在 TODO TUN -DADRA CA Ag A; ) (A; LIA eS Ax x 

xx PARA EES BS Catalan 数 , 该 数 呈 指数 增长 。 内 此 , 对 于 大 的 N, 穷 举 搜索 所 
有 可 能 的 排列 晨 厅 的 方法 是 不 可 行 的 。 然 而 . 这 种 计数 方法 为 一 种 解法 提供 了 基础 ,该 解法 
基本 后 足 优 于 指数 的 。 对 于 IRIN, «€ c EERE A, 的 列 数 。 于 是 A, Ae, 7. GME 
形 法 是 无 法 进行 的 。 我 们 将 定义 en 为 第 一 个 矩阵 A, 的 行 数 。 

UE pup ge Ee HEAT AR ERE E App Aron 1 Agger Ang 所 需要 的 乘法 次 数 。 为 方便 起 
K, mias tee 70. TRE BRE IE (Any tA CAL Ag). FEF Lefrszi < Right, 此 时 
所 用 的 乘法 次 数 为 Mepa T M+, Right T Clef- 1 Ci Right o ix =I ay BRITS GL; AL), 
CA, art Ago AACE TSR T RHET SETS 

如 果 我 们 定义 Men gas 为 在 最 优 排列 顺序 下 所 需 鉴 的 乘法 次 数 , 那么 , E Left < 
Right. Wl 

Mieft. Right = Lf Mrena + Misi, Riga + Cleft -1 CiCRight | 
这 个 方程 意味 着 ,如 果 我 们 有 乘法 Anni Arg BIRARE HUF, ATR A 
A. 和 及 ,1…A 和 ri 就 不 能 次 最 优 地 据 行 。 这 是 很 清楚 的 , 因为 否则 我 们 可 以 通过 用 最 优 的 计 
算 代替 次 最 优 计算 而 改进 整个 结果 。 

这 个 公式 可 以 直接 翻译 成 递归 程序 , 不 过 , 正如 我 们 在 最 后 一 节 和 着 到 的 , 这 样 的 程序 将 
是 明显 低 效 的 、 然 而 , 由 于 大 约 只 有 Mur ra [NT 2 个 值 需要 计算 , 因此 显然 可 以 用 一 个 
卡 米 存放 这 些 值 。 进一步 的 考查 表明 ,如果 Right — Left =k. 那么 只 有 在 Mio gg TE 
中 所 需要 的 那些 值 M， Ayo < b. 这 告诉 我 们 计算 这 个 表 所 需要 使 用 的 顺序 : 

如 果 除 最 后 答案 MI v 外 我 们 还 息 划 显示 实际 的 乘法 顺序 ,那么 我 们 可 以 使 用 第 9 章 中 
最 短路 符 算 法 的 思路 . 无 沦 何 时 改变 Mer ,pm ， 我 们 都 要 记录 的 值 , 这 个 值 是 重要 的 、 出 
此 得 到 图 10-46 所 示 的 简单 程序 。 

虽然 本 章 重点 不 是 编程 , 但 是 , 我 们 还 是 要 说 , AERA Ri TIRE See 
一 个 字母 这 并 没有 什么 好 处 。 可 是 这 里 c, i 和 大 却 是 作为 单字 和 母 变 量 使 用 的 ,这 是 因为 它 
f 与 我 们 描述 等 法 所 使 用 的 名 字 是 一 致 的 , 是 非常 数学 化 的 。 不 过 , RRR TH | | 作 
Xx. 因为 “1" 非常 像 “1”( 阿 拉 伯 数字 }, 如 果 你 犯 了 一 个 转换 错误 . 那么 可 能 会 陷 人 
非常 困难 的 调试 麻烦 让。 

回 到 算法 问题 上 来 。 这 个 程序 包含 三 重典 套 循环 , 容易 看 出 它 以 ONHE. 参考 
文献 描述 了 一 个 更 快 的 算法 , 但 由 于 执行 具体 息 阵 乘法 的 时 间 仍 然 很 可 能 会 比 计算 最 优 顺 厅 
的 乘法 的 时 间 多 得 和 多, 因此 这 个 算法 还 是 相当 实用 的 。 

10.3.3 最 优 二 叉 查 找 树 

第 一 个 动态 规划 的 例子 考虑 下 列 输 入 : 给 定 一 列 单词 wy, we, or wow 和 它们 出 现 的 男 
RUBER pi, pos es pws 问题 是 要 以 一 种 方法 在 一 棵 二 叉 查 找 树 中 安放 这 些 单词 使 得 总 的 
期 组 存 取 时 间 最 小 。 在 - - 棵 二 叉 查 找 树 中 , 访 间 深度 d 处 的 一 个 元 素 所 需要 的 比较 次 数 是 
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d^. 因此 如 果 u, 被 放 在 深度 d, 上 ,那么 我 们 就 要 将 NICO p + d) BM. 
| 


/* Compute optimal ordering of matrix multiplication */ 

/* C contains number of columns for each of the N matrices */ 
/* C[ 0 ] is the number of rows in matrix 1 */ 

/* Minimum number of multiplications is left in M[ 1 J[ N ) */ 
/* Actual ordering is computed via */ 

/* another procedure using LastChange */ 

/* M and LastChange are indexed starting at 1, instead of 0 */ 
/* Note: Entries below main diagonals of M and LastChange */ 
/* are meaningless and uninitialized */ 


vaid 
OptMatrix( const long CE J, int M, 
TwoDimArray M, TwoDimArray LastChange } 
i 
int i, k, Left, Right; 
long ThisM; 


for( Left = 1; Left <= N; Left++ ) 
M[ Left ][ Left ] = 0: 
fort k= 1; k < N; k++ 3} /* k 3s Right - Left */ 
for( Left = 1; Left «<= N - k; Left++ ) 
1 
/* For each position 7/ 
Right = Left + k; 
ML Left }[ Right ] = Infinity; 
forl i = Left; i < Right; i++ J 
i 


- 一 — .一 1 一 -一 -一 -一 一 
一 一 一 一 一 一 一 一 一 一 -. - 


ThisM = Mf Left JLi ] + ML i + 1 JL Right ] 
+ CL Left - 1] * CL i] * CE Right 1; 
if( ThisM < MT Left ]({ Right | ) 
| 
/* Update min */ 
MC Left IC Right ] = ThisM; 
LastChange[ Left ][ Right ] = 7; 


| 
| 
) 
| B 
图 10-46 ” 找 出 矩阵 莱 法 最 优 顺序 的 程 厅 
作为 一 个 例子 , 图 10-47 表示 在 柴 段 课文 中 的 士 个 单调 以 及 它 
irj AOE. 图 10-48 显示 三 标 可 能 的 二 义 查 找 树 。 它们 的 查找 
代价 如 图 10-49 FR. 
第 一 棵 树 是 使 用 仿 束 方法 培 成 的 。 存 取 概 率 最 高 的 单词 被 放 在 
根 节点 处 。 然后 左 丰 子 树 递 归 形 成 。 第 二 标 树 是 理想 平衡 查找 树 。 002 
这 两 棍 椅 都 不 是 最 优 的 ， 由 第 三 棵 树 的 存在 可 以 证 实 。 我 们 由 此 看 Lo | o% jJ 
到 明显 的 解法 都 是 行 不 通 的 ， mio 骂人 二 又 本 
乍 看 有 此 奇怪 ,因为 问题 看 起 来 很 像 是 构造 Huffman WER, 。 峙 问题 的 样本 输 人 人 
下 如 我 们 已 经 看 到 的 , 它 能 够 用 贪 禁 算法 求解 ， 构造 一 标 最 优 二 又 
在 找 树 更 困难 , 因为 数据 不 只 限于 出 现在 树叶 上 ， 树 还 必须 满足 二 又 查找 树 的 和 件 奈 。 
动态 规划 解 由 两 个 观察 结论 得 到 。 下 次 假设 我 们 想 要 把 ( 排 疗 的) 一些 单间 Wet, 
Wet tie o Right -l> Wight 放 到 一 棵 二 又 查找 树 中 。 设 最 优 二 兴 查 找 树 以 w, VE XR. H 
中 Left Si Right, 此 时 左 子 树 必 须 包 含 wps cO wie 而 右 子 树 必须 包 合 w+. Us 
usm( 根 据 二 叉 查找 树 的 性 质 )。 再 有 , 这 两 梨子 笃 还 必须 是 最 优 的 ， 因为 否则 它们 可 以 用 最 
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C PRN. 这 将 给 出 基于 wry ts gu ECT ERES te, RTS ACE SUE REIS 
开销 Crus, gus Ba — PK. 图 10-50 可 能 足 有 帮助 的 ， 








一 


| MBA RE a Bi #3 | 
| 单词 概率 Vio Hr Vi al P6 8r Viu fer | 
B, Py 
a Git 


Once Sequence Once Sequence Onee Sequence 











2 0.44 3 (1.66 2 (had 

am 0.18 4 0.72 2 0.36 0.54 

and 0.20 3 0.60 3 0.60 0.20 

eB 0.05 4 0.20 1 0.05 3 0.15 l 
T 0.25 I 1.25 3 0.75 2 0.50 

the 0.02 3 0.06 2 0,04 4 0.08 | 
two 0.08 i16 3 . } . 





图 10-50 Rit RAR AD aie 


hn Left > Right, 那么 树 的 开销 是 0; 这 就 是 NULL 情形 , 对 于 二 义 查 找 树 我 们 总 有 这 
种 情形 , 否则, BIER po 左 子 树 的 代价 相对 于 它 的 根 为 Cry. ,-1， 右 子 树 相 对 于 它 的 根 的 
代价 为 C-i Riche 如 图 10-50 Bras. 这 两 棵 树 的 每 个 节点 从 w; 开始 都 比 从 它们 对 应 的 根 开 


PRE, 因此, 我 们 必须 加 Sp, AD 记 。 于 是 得 到 如 下 公式 


. | a 7^ 十 1 
» 4,7 min of Be t+ Chet T Coa, Ra + oP 2u Py! 
C. Righi lef Enun Rut | Pi Lerta: : ia 47 Lo? / geet] 
Riu i 
. Vet ` L 
= min (Chg crt Ciri, Right + ` P 
Left rt: Right y= Left 


从 这 个 方程 可 以 直接 编写 一 个 程序 来 计算 最 优 二 叉 但 找 树 的 价值 。 像 通常 一 样 ， 具体 二 
查找 树 可 以 通过 存储 使 Coop rigis 晤 小 化 的 i EMRE FE. 标准 的 递归 例 程 可 以 用 来 显示 具 
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WEBS AY 
图 10-51 显示 将 由 算法 产 牛 的 表 , MPa PR, 最 优 二 义 查 找 树 的 价 但 和 根 
都 被 保留 - 最 底部 的 项 计算 输入 的 全 部 单词 集合 的 最 优 一 义 查找 树 . 最 优 树 是 图 10-48 中 及 





Left=1 Lefl=2 Left=3 Lett=4 Left-5 Left=é Left=7 
iat i the..the | twp. two 
OR | two 





















and | .05 | EE 
“eget | 





BAR =2 

eR = 

BAAR =4 

ges am the | and twa 
7 [GB and [Ton 

am.. ， 

s ate] 

AR Sami 

A= - 


图 10-51 对 于 样本 输入 的 最 优 二 浆 查 找 树 的 计算 


对 于 一 个 特定 的 子 区 域 即 am. if 的 最 优 一 叉 查 找 树 的 精 人 确 的 计算 如 图 10-52 Bt. Ee 
i SUH GLE RR ADCS am, and, egg 利 计 所 得 的 最 小 ( 价 ) 值 树 而 得 到 的 - 例如 、 当 and RATE 
HARDIE, 左 子 树 包含 om. .am( 通 过 前 面 的 计算 , 值 为 0.18), 右 子 树 包 售 egg. iL CR 
| 0.35), TH Pant paa * Da + Bi 一 0.68, 总 价值 为 1.21。 
[389 





0 0,80 + (0.68 = 148 DIS 40.35 4 O88 = 1.2] 
(ces) if 
aN van 
0.456 + 0.25 + 0.68 = 1.49 (L66 + 04 0.68 = 1.34 


图 10-52 Rt am. ,让 的 表 项 (1.21，and) 的 计算 


六 个 算法 的 运行 时 间 是 O(N3), 因为 当 它 实 现时 , 我们 得 惠 一 个 三 重 循环 对 十 这 个 问 
w .种 DCN2) 算 法 在 一 些 练习 中 进行 了 概述 . 
10.3.4 所 有 点 对 最 短路 径 | 

我 们 的 第 三 个 也 是 最 后 一 个 动态 规划 应 用 是 计算 有 向 图 G = CV... 巨 ) 中 每 一 点 对 问 赋 权 
最 短路 径 的 一 个 算法 。 在 第 9 章 我 们 看 到 单 发 点 最 短路 径 问 题 的 一 个 算法 ， 该 算法 找 出 从 任 
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意 一 点 s 到 所 有 其 他 项 点 的 最 短路 径 - AARE (Dijkstra) MARARA OC! YI?) 时 间 运 行 ， 
但 是 实际 上 对 稀 朴 的 图 更 快 。 我 们 将 给 出 一 个 短小 的 算法 解决 对 稠密 图 的 所 有 点 对 的 问题 - 
这 个 算法 的 运行 时 间 为 OC VIA), TE EEXI Dijkstra 3E V. 次 夺 代 的 一 种 新 进 改进 但 对 非 
芝 福 密 的 图 可 能 更 快 ， 原 因 是 它 的 插 环 更 紧 泰 . MRE LANAI A A, HRA 
这 个 算法 也 能 正确 运行 ;而 Dijkstra 算法 此 时 是 失败 的 。 

让 我 们 回忆 Dijkstra 算法 的 一 些 重 要 细节 (读者 可 以 复习 9.3 08). Dijkstra 算法 在 顶点 并 
始 并 分 阶段 工作 ., 图 中 的 每 个 兢 点 最 终 部 要 被 选 作 中 和 间 顶 点 ， 如 果 当 前 所 选 的 项 反 是 v, 那么 
MTA wEV, Bd.=min(d,. d.c... 这 个 公式 是 说 ,从 s) 到 w 的 最 舍 距 离 或 者 是 
前 面 知 道 的 从 s 到 w RBS, 或 者 是 从 ;( 最 优 地 ) 到 v 然后 和 直接 从 v Bw AR. 

Dijkstra 算法 提供 了 动态 规划 算法 的 想法 : 我 们 依 序 选 择 这 些 顶 点 。 我 们 将 D, ,定义 
AM v, Slo, RBH, vo, oo, v PEAR Re RR, RRR EX, Dos = 
ci,» BPA Co. y PERN c Æo. BER, BBX, Divi; AAPA, 2] o, 的 
IR E S e 

如 图 10-53 Bras, 24 k 20 时 我 们 可 以 给 Di. F 写 出 一 个 简单 公式 ,从 v F U A 
vi, te 77, v FEA PSR RAR ARATE v, 作为 中 间 人 项 点 的 最 短路 答 , 或 
FARA voro, 入 一 vw 合并 而 成 的 最 短路 径 ， Hop e e RTI e-i ^^ TR 
点 作为 中 间 顶 点 。 这 导致 下 面 的 公式 


— 


i /* Compute All-Shortest Paths */ 
/* AL ] contains the adjacency matrix */ 
/* with AL i 1[ i ] presumed to be zero */ 
/* U[ ] contains the values of the shortest path */ 
/* M is the number of vertices */ 
/* A negative cycle exists iff */ 
/* DE i JL i J is set to a negative values */ 
/* Actual path can be computed using Path[ ] */ 
/* All arrays are indexed starting at 0 */ 
/* NotAVertex is -1 */ 





void 
All Fairs TwoDimArray A, TwoDimArray D, 
TwoDimArray Path, int N ) 
i 
int i, j, k; 


/* Initialize D and Path */ 


/* l*/ for( i= 0; 3 < Ni i++ 2 
f[* 2*/ for( j= 0; j < N; je 2 

| 
ft 3a/ OF i WG] =AL i 1[ j 3: 
A arf Path[ i J j ] = NotAVertex; 

} 
f® 5*7 for( k = 0; k < N; k+ ĵ 

/* Consider each vertex as an intermediate "/ 
/* G*/ farf d = Q; i «Ny i++ ] 
A Pe fort j 20; j « Ni j++ D 
f* B*/ WFO DE iG Jk 1 + Ok Jig] «DE 3 1([ 3 1 ? 

{ 
/* Update shortest path */ 

/* 9*/ DLiJLj31sbLi JLk J * DL k ME 3 J: 
/*10* / PathE i J( k 15 k; 


图 10-53 ”所 有 点 对 最 短路 径 


EZ) 
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9t Di = mini D, born D-i, a t D, Lpi 
MIRRE OC VI. BS A GE StS MER FAT, ARRE EKRE 
方法 降低 。 


因为 第 上 阶段 只 依赖 于 第 (一 1 阶段 , 所 以 看 来 只 有 两 个 | VY | x Vm SERE. 然 
而 ,在 用 开始 或 结束 的 路 径 上 以 作为 中 间 顶 点 对 结果 没有 改进 , REET 
因此 只 有 一 个 矩阵 是 必须 的 , 因为 Doo = D, 和 De = D a, ;这 意味 着 右边 
的 项 痢 不 改变 值 苹 都 不 需要 存 情 -. 这 个 观察 站 果 导 致 图 10-53 中 的 简单 程序 ， 为 与 C 的 约定 
-一致 ， 该 程序 将 顶点 从 0 开始 编号 ， 

在 一 个 完全 图 中 , 每 一 对 顶点 (在 两 个 方向 上 ) 都 是 连通 的 , 该 算法 几乎 肯定 要 比 Dijkstra 
算法 的 | VUE RR. 因为 这 里 的 循环 非常 紧凑 ,第 1 行 到 第 4 行 可 以 并 行 执行 , 第 6 行 到 
第 10 行 也 可 并 行 执 行 . 因此 , 这 个 算法 看 来 很 适合 并 行 计 算 。 

动态 规划 是 强大 的 算 靶 设计 技 与 ， 它 给 解 提 供 一 个 起 点 。 它 基本 上 是 首先 求解 一 些 更 简 
单 问题 的 分 治 算法 的 范例 ,重要 的 区 别人 条 于 这 些 更 简单 的 问题 不 是 原 问 题 的 明确 的 分 割 . 因 
为 子 问 题 反 复 被 求解 ， 所 以 重要 的 是 将 它们 的 解 记录 在 一 个 表 中 而 不 起 重新 计算 它们 。 ER 
些 情况 下 , 解 可 以 被 改进 (虽然 这 确实 不 总 是 明显 的 日 常常 是 困难 的 )， 而 在 另 -- 些 情况 下 ， 
动态 规划 方法 则 是 所 知道 的 最 好 的 处 理 卢 法 。 

在 菜 种 意义 上 上， 如 果 你 看 出 一 个 动态 规划 问题 ,那么 你 就 看 出 所 有 的 问题 。 动 人 态 规 划 岗 
多 的 例子 在 一 些 练习 和 和 参考 文献 中 可 以 找到 。 


10.4 随机 化 算法 


假设 你 是 一 位 教授 , 正在 布置 每 周 的 程序 设计 作业 。 你 想 确 保 学 生 在 完成 白 己 的 程 施 ， 
或 至 少 理解 他 们 提交 上 来 的 程序 。 一 种 解决 方案 是 在 每 个 程序 呈 交 的 当天 进行 一 次 测验 ( 面 
武 )。 另 一 方面 ,这 些 测验 花费 课外 时 间 , 因此 实际 上 只 能 对 大 约 半数 的 程序 可 以 这 么 做 ., 你 
的 问题 是 决定 什么 时 候 进 行 这 些 测 验 

当然 . 如 果 事 先 宣布 这 些 测 验 , 那么 这 可 以 解释 为 对 得 不 到 测验 的 50% 程序 的 默许 作 
Wk. 你 可 能 采取 不 官 布 的 策略 对 备 选 的 程序 进行 测验 , 不 过 学 生 们 很 快 就 会 搞 清 楚 这 种 作 
法 . 另 一 种 可 能 是 对 看 似 重要 的 程序 进行 测验 ,而 这 又 会 进 露 从 学 期 到 学 期 类 似 的 测验 风 
格 . 学 生 传 播 部 考 些 什么 样 的 题 , 这 种 策略 很 吉 能 经 过 一 个 学 期 以 后 就 没有 什么 价值 了 - 


392, AE EO MC — 1967; HE EE (EHE — T BED, 测验 对 每 一 个 程序 进行 (举行 测 答 远 个 如 给 


他 们 评分 消耗 时 间 ), 在 开始 上 课时 教授 将 描 硬 币 来 决定 是 省 要 举行 测验 . 采用 这 种 方式 . 在 
上课 前 不 可 能 知道 测验 是 否 要 进行 ， 而 测验 的 模式 从 学 期 到 学 期 之 间 也 不 重复 - ux EE. ORT 
前 面 的 测验 都 是 什么 规律 , 学 生 只 能 预计 测验 发 年 的 概率 将 是 5096 © 这 种 方法 的 缺点 是 有 出 
能 整个 学 期 都 没有 测验 , 不 过 这 不 太 可 能 发 生 , 除非 硬币 有 问题 。 每 个 学 期 测验 的 期 望 次 数 
是 得 序数 日 的 一 半 ,， 并 旦 测验 的 寥 数 将 以 高 概率 不 会 太 偏离 这 个 数目 。 

这 个 例子 叙述 了 我 们 称 之 为 随机 化 算法 (randemized algorithm) 的 方法 。 FERGAL, B 
机 数 至 少 有 一 次 用 于 决策 。 该 算法 的 运行 时 间 不 只 依赖 于 特定 的 输入 ， 而 且 依 赖 于 所 发 生 的 
METLE. 

— An BL A E 1: Be Up FT m TBSL TR E AU SE RSA Ck BEE BU RH ES T RT e 
fj], mESÉBJECEMET , 好 的 随机 化 算法 没有 不 好 的 输入 ， 丽 只 有 坏 的 随机 数 ( 相 对 于 特定 的 输 
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AJ) 这 看 起 来 像 是 只 是 哲学 上 的 差别 , 但 是 实际 上 它 是 相当 和 草 要 的 , 正如 直面 的 例子 所 示 、 

兰 虑 快速 排序 的 防 种 变形 ., 方法 A 用 第 一 个 抑 素 作为 枢纽 元， 出 方法 了 使 用 随机 选 出 的 
元 素 作 为 枢纽 元 : 在 这 阿 种 情形 下 , 最 坏 情 形 运行 时 间 部 是 9(N*), 因为 在 每 一 步 都 有 可 能 
ARRAN CRE ADA. 两 种 她 坏 情 形 之 间 的 区 别 在 于 , 存在 特定 的 输入 总 能 吉 出 现在 
A 中 并 产生 不 好 的 运行 时 间 。 当 每 一 次 给 定 已 排序 数据 时 ,方法 A 者 将 以 BCN ) 时 间 运 行 ， 
如 果 方 法 B 以 相同 的 输入 运行 两 深 , 那么 它 将 有 两 个 不 同 的 运行 时 间 , 这 依赖 于 什么 样 的 随 
UL. 

(es £r RIS LEE RIER LEES Bi A Ap ee Pe. Se eH RR, PED 
儿 乎 排序 的 输 人 常常 要 比 统计 上 期 望 的 出 现 得 多 得 多 ,而 这 会 产 竺 一些 问 题 , 特别 是 对 快速 
排序 和 二 叉 查 找 树 。 通 过 使 用 随机 化 算法 ,特定 的 输入 不 再 是 重要 的 。 重 时 的 是 随机 数 ， 我 
们 可 以 得 到 - :个 期 望 的 运行 时 间 ， 此 时 我 们 是 对 所 有 可 能 的 随机 数 取 平 均 而 不 是 对 所 有 可 能 
的 输入 求 平均 ,使 用 随机 枢纽 元 的 快速 排序 算法 是 一 个 O(N log NN) 期 望 时 间 算 法 ,这 号 是 
说 , 对 任意 的 输入 , 包括 已 经 排序 的 输入 , 根据 随机 数 统计 学 理论 , 运行 时 间 的 期 望 但 为 
OCN log N)。 期望 运行 时 间 界 多 少 要 强 于 平均 时 间 界 , 但 是 ,当然 要 比 对 应 的 最 坏 情形 前 
弱 ,， 另 -方面 ,正如 我 们 在 选择 问题 中 所 看 到 的 , 得 到 最 坏 情 形 时 间 界 的 那些 解决 方案 共 常 
不 加 | 已 们 的 平均 情形 那样 在 实际 中 常见 。 但 是 , 随机 化 算法 却 通 常 是 一 致 的 . 

在 这 一 节 , 我 们 将 考查 随机 化 的 两 个 用 途 ,, 首先 , 我 们 将 介绍 以 O(log N ;期望 时 间 支 持 
二 丸 在 找 树 操作 的 新 颖 的 方案 。 这 意味 首 不 存在 坏 的 输入 ， 只 有 坏 的 随机 数 。 从 理论 的 观点 
看 . 这 并 没有 那么 令 入 振 查 ,因为 平衡 但 找 树 侍 最 坏 情 形 下 达到 了 这 个 界 。 然而 , 随机 化 的 
使 用 导致 了 对 查找 、 插入、 特别 是 删除 的 相对 简单 的 算法 。 

第 “个 应 用 是 测试 大 数 是 和 否 是 素数 的 随机 化 算法 。 对 于 这 个 问题 , 没有 已 知 的 有 效 的 多 
mm s HEBES ILE E. 我 们 介绍 的 这 种 算法 运行 很 快 但 偶尔 会 有 错 。 不 过 , BER EHR 
的 概率 可 以 小 到 忽略 不 计 - 

10.4 1 ENBER 

d TGO EHE ELE. 因此 我 们 必须 要 有 一 种 廊 法 点 生成 它 。 实际 上 , 真正 的 随 
机 性 在 计算 机 上 是 不 可 能 的 , 因为 这 些 数 将 依赖 于 算法 ， 从 而 不 可 能 是 随机 的 。 一 般 说 来 ， 
y" np Sy BURL C pseudorandom number) 8 e 8E T, 多 随机 数 是 看 起 来 像 是 随机 的 数 。 随机 数 有 
许多 已 知 的 统计 件 质 ; 伪 随 宙 数 满足 这 些 性 质 的 大 部 分 。 令 人 惊奇 的 是 , 这 说 起 来 容易 , 做 起 
OUI EE E T- i 

设 我 们 只 需要 抛 一 枚 硬币 ， 这 样 , 我 们 必然 随机 地 生成 0 或 1。 一 种 做 法 是 考查 系统 时 
钟 、 这 个 时 钟 可 以 把 时 间 记 录 成 整数 , 而 这 个 整数 是 从 其 个 起 始 时 刻 开始 计数 的 秒 数 。 此 时 
我 们 可 以 使 用 它 的 最 低 二 进 制 位 。 问题 在 于 ,如果 希 要 随机 数 序列 , 那么 方法 就 不 理想 了。 

. 秒 是 .个 长 的 时 间 段 , 在 程序 运行 时 这 个 时 钟 可 能 根本 没 变化 。 即 使 时 间 用 微妙 为 单位 记 
录 。 如 果 程序 自身 正在 运行 , 那么 所 生成 的 数 的 序列 也 远 不 是 随机 的 ， 内 为 在 对 发 生 器 的 多 
次 调用 之 间 的 时 间 在 每 次 程序 调用 时 可 能 都 是 一 样 的 。 此 时 我 们 看 到 , 真正 需要 的 是 随机 数 
M) AF HY (sequence) , 3X AER hy AT sr XB HL tu SE rf d H9 Fes b PLI REGE TR, HAR 
Dac HLH der | BAL rt a E Tr Ro GA LS] EHS - 


“在 梧 季 的 其 您 部 分 我 们 将 使 用 随机 代 蔡 伪 随 机 


E 


E 





PE RR E fe] RT PEI Re Ae, ETF 1951 年 由 Lehmer 首先 描述 . 数 

ro ea. vu RERE 
r,.Q7 Ar, mod M 

为 了 开始 这 个 序列 ,必须 给 出 xs 的 某 个 值 . AEn T (seed), WE x97 0, 那么 这 个 
序 刻 二 不 是 随机 的 , 但 是 如 果 A MM 选择 得 正确 , 那么 任何 其 他 的 Islay ME SH 
AeA), WE M 是 素数 , 那么 zx; 就 绝 不 会 是 0: 作为 一 个 例子 , 如果 MTM, A=7, fi xol, 
那么 所 生成 的 数 为 

7,5, 2,3, 10, 4,6,9,8, 1,7,5,2, “0” 

注意 , 在 M-1=10 个 数 以 后 , 序列 将 重复 . 因此 , 这 个 序列 的 周期 为 M 一 1, CRT REER 
(根据 住人 原理 )。 邵 果 M 是 素数 ,那么 总 存在 对 A 的 一 些 选择 能 够 给 出 整 周 期 (all period) M — 1, 
对 A 的 有 些 选 择 刚 得 不 到 这 样 的 周期 ;如 果 A —5 而 xo=1, BAR Pes. 

5.3,4,9,1, 5,3, 4, oo 

如 果 MAAK, EA 31 比特 的 素数 , 那么 对 于 大 部 分 的 应 用 来 说 周期 应 该 是 非常 
长 的 Lehmer 建议 使 用 31 个 比特 的 素数 M = 27! — 1 =2 147 483 647。 对 于 这 个 素数 . A= 48 271 
是 给 出 整 周期 发 生 器 的 许多 值 中 的 -一 个 。 它 的 用 途 已 经 被 深入 研究 并 被 这 个 领域 的 专家 推 
ESO 后 面 我 们 将 看 到 ,对 于 随机 数 发 生 器 ， 贸 然 收 改 通 常 意味 善 失败 ,因此 我 们 替 劝 还 挟 纺 
续 坚 持 使 用 这 个 公式 直到 有 新 的 成 果 发 布 。 

这 像 是 一 个 实现 起 来 很 简单 的 例 程 。 一 般 地 , 全 局 变量 用 来 存放 x 的 序列 的 当前 值 : 这 
是 全 局 变量 发 挥 作用 的 罕见 情况 。 这 个 全 局 变量 由 某 个 癸 程 初始 化 。 当 调试 -- 个 使 用 随机 数 
的 程序 的 时 候 , 大 概 最 好 是 置 ru= 1, 这 使 得 总 是 出 现 相同 的 随机 序 州 。 当 程序 工作 时 ,可 以 
使 用 系统 时 钟 , 也 可 以 要 求 用 户 输入 一 个 值 作为 种 于 。 

返回 一 个 位 于 并 区 间 (0, 1) 的 随机 实数 (0 和 1 是 不 可 能 取 的 值 ) 也 是 党 见 的 情况 ;这 可 以 
通过 除 以 M 得 到 。 由 此 可 知 , 在 任意 闭 区 间 [a“ ，B] 的 随机 数 可 以 通过 规范 化 来 计算 。 这 将 广 
族 图 10-54 中 “明显 的 ” 例 程 , 不 过 , 该 例 程 只 在 很 少 的 桃 器 上 能 够 正常 运行 。 


static unsigned long Seed = 1; 


#define A 48271L 
#define M 2147483647. 


double 
Random( void ) 


Seed = ( A * Seed J & M; 
return ( double } Seed / M; 
t 


void 
Initialize( unsigned long InitVa! J 
{ 


Seed = Initval; 
} 





H 10-54 ”不 能 正常 工作 的 随机 数 发 生 疾 


这 个 例 程 的 问题 是 乘法 可 能 溢出 ;虽然 这 个 是 一 个 错 放 ， 但 是 它 影响 计算 的 结果 ， Ma 
影响 伪 随 机 性 ，Schrage 给 出 一 个 过 程 ， 在 这 个 过 程 中 所 有 的 计算 均 可 在 32 位 机 上 进行 而 不 会 
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溢出 ,我们 计算 M/A 的 商 和 余数 并 把 它们 分 别 定 多 为 Q@ 和 RR, 在 上 述 情 况 下 ，Q = 44 488, 
R-3399, R Q. 我 们 有 








T= Ar, mod M = Ar; -M| = Ar, | 
onc gj B] SP 
ENERE 


由 于、 = alg | + x modQ, RITARA BMH Ar, 并 得 到 


rape a {Q Q5 la 1,modQ ]- | v a ML] ^i 
= (AQ - M)| 5 AMT. P 
但 M=AQ+R, Al AQ-M - - R. 于 是 我 们 得 刘 


zim = Alay mod Q) - R| Z |+ Mi aj- ls | 


maa= [Gii 


FRITH 








| 或 者 是 0, 或 者 是 1, MAPIA REKTEN. 因此 ， 


tia) = Ala; mod Q) 一 R| A + MO(r,) 


局 速 验证 表明 , AARO, 故 所 有 的 余 项 均 可 计算 而 没有 浇 出 (这 就 是 选择 AA=48271 
的 原因 之 一 )。 此 外 , 仅 当 余 项 的 值 小 于 0 时 ,5(x;)=1。 因此 (x,) 不 需要 显 式 地 计算 而 是 
可 以 道 过 简单 的 测试 来 确定 。 这 导致 图 10-55 中 的 程序 。 


static unsigned long Seed = 1; 





| sdefine A 48271L 
edefine M 21474R3647L 
#define Q (M / A } 
xdefine R ( M X À 


double 
Randomi void } 
1 
long TmpSeed; 


TmpSeed = A * ( Seed X Q) - R * ( Seed / Q); 
if( TmpSeed >= à ) 

Seed = TmpSeed: 
else 

Seed = TmpSeed + M; 


return ( double } Seed / M; 


void 

Inirialize( unsigned long ImtVal ) 

1 
Seed = InitVal: 

I 


图 10-55 工作 十 32 PLEA RRL et 


ace 
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FAS INT _MAX222°!—1, 这 个 程序 就 能 正常 工作 - ATR RBS ABRE t PIS HL 
在 它们 标准 库 中 都 有 一 个 至 少 像 图 10-55 中 的 程序 那么 好 的 随机 数 发 生 器 ,但 粳 粒 的 是 , 情 
(RA xe. EEH A SRE FF RE 

34, = (Ar, + C) mod 2? 
其 中 B 的 选取 要 匹配 机 器 整数 的 位 数 , 而 C 是 奇数 ,这 些 库 也 返回 x, ,和 而 不 是 0 和 1 之 问 的 
MA. 不 幸 的 是 , 这 些 发 生 器 总 是 产生 在 奇偶 之 间 交 错 的 zx, 的 年 一 一 很 难 具 有 至 想 的 性 
质 . 事实 上 ,《〈 充 其 三 ) 是 低 上 位 以 则 期 关 循环 。 许多 其 他 随机 数 发 生 器 雪 比 图 10-55 所 提供 
的 随机 数 发 生 器 的 循环 小 得 多 . 这 些 发 千 跨 对 于 需要 长 的 随机 数 序列 的 情 襄 足 不 合适 的 . xx 
后 , 我 们 通过 添加 一 个 常数 到 方程 中 去 可 能 会 得 到 更 好 的 随机 数 发 生 右 。 例 如 、 
xi 7482712, +1) mod (21 - D 
多 少 会 更 加 随机 一 些 。 xx PET AKER A ERE AP IAS SIR o 
[48 271(179 424 105) +1] mod (2?! — 1) = 179 424 105 

因此 . WERF 179424105, 那么 发 生 器 将 陶 入 周期 为 1 的 循环 。 
10.4.2 PARR 

随机 化 的 第 一 个 用 途 是 以 O(log N) 期 望 时 间 支 持 查 找 和 插 人 的 数据 结构 .正如 在 本 下 介 





缚 中 所 提 到 的 , 这 意味 着 对 于 任意 输入 序列 的 每 一 次 操作 的 运行 时 间 剖 有 期 望 值 O Clog ND, 


其 中 的 期 望 是 基于 随机 数 发 生 器 的 。 能 够 洪 加 遇 除 和 所 有 涉及 排序 的 操作 并 得 到 与 一 叉 碍 找 
树 的 平均 时 间 界 匹配 的 期 望 时 间 界 。 

最 简单 的 支持 查找 的 可 能 的 数据 结构 是 链表 。 图 10-56 是 一 个 简单 的 链 小 . 执行 一 次 碍 
线 的 时 间 正 比 于 必须 考查 的 节点 个 数 , 这 个 个 数 最 多 是 N. 





图 10-56 简单 链表 


ki 10-57 表示 一 个 链表 , 在 该 链表 中 , SR D GT EP HG TET TREE TES PAI 
了 两 个 位 置 二 的 节点 。 正 因为 如 此 , 在 最 坏 情形 下 , REPA NAZAL I Re 


Cibo Besten Eon: 


图 10-57 HABEAS 2 个 表 元 素 的 指针 的 链表 


将 这 种 想法 扩展 ,我们 得 到 图 10- 58。 这 里 , 每 个 序数 是 4 的 倍数 的 节点 都 有 一 :个 措 针 指 
向 下 一 个 序数 是 4 的 信和 数 的 节点 。 只 有 [N41+2 个 节点 被 考查 。 





图 10-58 ” 带 有 指向 前 而 第 4 个 表 元 素 的 指针 的 链 直 


41 


这 种 跳跃 幅度 的 一 般 情 形 如 图 10-59 所 示 , 每 个 2: 节点 就 有 一 个 指针 指向 下 
点 .总 的 指针 个 数 仅 仅 是 加 倍 , 但 现在 在 一 次 查找 中 最 多 考查 | log N] 个 节点 。 不 难看 到 ， 
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次 查找 总 的 时 间 消 耗 为 Oflog N)， 这 是 因为 查找 由 癌 前 到 一 个 新 的 节点 或 者 在 同一 节点 下 
降 到 低 一 级 的 指针 组 成 。 在 一 次 查找 期 间 每 一 步 总 的 时 间 消 耗 最 多 为 Otlog NO. 注意 , 在 这 
种 茹 所 结构 中 的 个 找 基本 上 是 折 半 但 找 (binary search)» 





图 10-59 带 有 指向 前 面 第 2: Seon RIS Pr BER 


这 种 数据 结构 的 问题 是 有 效 的 插入 太 过 于 有 呆板 。 使 用 这 种 数据 结构 的 关键 是 笑 敌 履 松 结 
KE ls 我 们 将 带 有 到 PRET AAT SE MA Br PA (level k node), WP 10-59 所 小 , 任意 e 
阶 节点 上 的 第 i 阶 ( 宇 门 指针 指向 的 下 一 个 节点 至 少 有 具有 i 阶 ; 这 是 一 个 容易 保留 的 性 质 ， 
不 过 , 图 10-59 指出 比 它 更 有 限制 性 的 性 质 . BOR, 我 们 把 第 ;个 指针 指 问 前 面 第 2 PA 
的 这 个 限制 去 掉 , 而 代 之 以 上 面 稍 松 一 些 的 限制 条 件 。 

当 需 要 播 人 新 元 素 的 时 候 , 我 们 为 它 分配 一 个 新 的 节 态 ,此 时 ,我 们 必 顷 决定 寺 太 二 是 
多 少 阶 的 . 考查 图 10- 59 我 们 发 现 , 大约- : 半 的 节点 是 1 阶 节点 ， 大约 1/4 的 节点 是 2 阶 节 
点 , 一役 地 ,大 约 1/2: 的 节点 是 i 阶 节 点 。 我 们 按照 这 个 概率 分 布 随 机 选择 节点 的 阶 数 。 琉 
容易 的 方法 是 抛 一 校 硬币 直到 正面 出 现 并 把 抛 硬币 的 总 次 数 作 为 该 节点 的 阶 数 。 图 10-60 i 
AS — T BLAU EEA XE (skip list) s 





图 10-60 — ERA 


给 出 上 面 的 分 析 以 后 , 跳跃 表 算法 的 描述 就 简单 了 为 执行 一 次 Find, 我 们 在 头 节 点 从 
最 高 阶 的 指针 开始 , 沿 着 这 个 阶 一 直 走 ， 直 至 找到 大 于 我 们 正在 寻找 的 节点 的 下 一 个 下 所 
(x ER NULLOBIGEF. 这 个 时 候 , 我 们 转 到 低 一 阶 的 阶 并 继续 这 种 方法 - SET I Be 
止 时 , 或 者 我 们 位 于 正在 寻找 的 节点 的 前 面 , 或 者 它 不 在 这 个 表 中 。 为 了 执行 一 次 Inen, R 
人 | 像 在 执行 Find 时 那样 ,始终 监视 每 一 个 使 我 们 转 到 下 一 阶 的 节点 。 最后. A ACE 
阶 基 随机 确定 的 ) 拼 接 到 表 中 。 操作 见 图 10-61. 





图 10-61 4H A BI RIMEÉLA IA BEEK e 
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粗 路 分 析 指 出 , HPA A CSE A) SP_TL 
HS RAAB TAO BY LER ERE. BARRA. RR fh 
O(log NJ, 当然, PUB SUE UEBER S ERU, 但 它 与 这 里 没有 太太 的 区 别 ， 

PER ARAS FRO, 它们 都 需要 估计 表 中 的 元 束 个 数 ( 从 而 阶 的 个 数 可 以 确定 )， 如 条 
得 不 刘 这 种 估计 , BAR oI VR PS A ee — PAGAN T BE BAIE (rehash) 897r 3; a 
经 验 表明 ,， PERANTEAU AK, MER. 用 许多 种 语言 实现 都 会 简单 
得 多 . 

10.4.3 索性 测试 

在 这 一 节 , 我 们 考查 确定 一 个 大 数 是 否 是 素数 的 问题 。 不 如 在 第 2 RRA, Xe 
窗 耕 方案 依赖 于 大 数 分 解 的 困难 竹 ， 比 如 将 一 个 200 位 数 分 解 成 两 个 100 EAR BE. 2 
[实现 这 种 方案 , 我 们 需要 一 种 生成 两 个 大 素数 的 方法 , 因为 现在 没有 人 知道 如 何以 d 的 多 
硕 式 时 间 测 试 一 个 a 位 数字 的 数 N 是 否 是 素数 , 所 以 分 钥 大 素数 的 问题 主要 还 是 理论 上 的 问 
M. 例如 ,测试 能 否 被 从 3 到 VN 的 奇数 整除 的 常用 方法 大 约 稍 要 方 V 玉 次 除法 , 它 大 约 为 
2/2. 另 一 方面 , 这 个 问题 不 被 认为 是 NP 完全 的 ;办 此 , 它 是 处 在 边缘 上 的 少数 区 个 问题 之 
它 的 复杂 性 在 编写 本 书 时 尚 不 灿 道 . 

在 这 一 章 , 我 们 将 给 出 一 个 可 以 测试 素性 的 多 项 式 时 间 算 法 。 如 果 这 个 算法 宣称 一 个 数 
AER, 那么 我 们 可 以 肯定 这 个 数 不 是 素数 。 如 果 该 算法 宣称 -个 数 是 素数 , 那么 , 这 个 
数 将 以 高 的 概率 而 不 是 100 另 肯定 是 素数 。 错误 的 概率 不 依 闵 于 被 测试 的 特定 的 数 , 而 是 依 
炳 于 出 算法 作出 的 随机 选择 . 因此 , 这 个 算法 偶尔 会 出 错 , 不 过 将 会 看 到 , 我 们 可 以 让 出 竺 
的 比率 任意 小 。 

等 法 的 关键 是 着 名 的 费 蕊 (Fermat) 定 理 ， 

定理 10.10 

UNE, 如 果 PP 是 素数 , LOK A<P, 那么 A” 1=1 (mod P). 

证 明 : 

这 个 定理 的 证 明 可 以 在 任 一 本 数论 教科 书 中 找到 。 

例如 ,由 于 67 是 素数 , 因此 29991 (mod 67)。 这 提出 了 测试 一 个 数 N 是 否 是 素数 的 算 
法 ,中 要 检验 一 下 是 再 2x-I 二 1 (mod N): BSE 271551 (mod N) 不 成 立 ,那么 我 们 可 以 肯定 
w 不 还 素数 。 另 一 方面 , 如 果 等 式 成 立 , 那么 N 很 可 能 是 素数 。 例如 , 满足 六 ”一 1] (mod N) 
但 不 是 素数 的 最 小 的 N 是 只 =341- 

这 个 算法 偶尔 会 出 销 , 但 问题 是 它 总 出 一 些 相同 的 错误 。 换 名 话说 , 存在 N 的 一 个 国定 的 
集合 , 对 于 这 个 集合 该 方法 行 不 通 。 我们 可 以 尝试 将 该 算法 如 下 随机 化: 随机 取 I< A<N-L: 
aot AN =l (mod ND, 则 宜 布 N 可 能 是 素数 ,否则 宣布 N 肯定 不 是 素数 。 如 果 ON = 341 rfi] 
A =3 那么 我 们 发 现 3 =56 (mod 341)。 因 此， 如 果 算 法 碰巧 选择 A = 3, WA ERX 
Y=34! 得 到 正确 的 答案 。 

虽然 这 看 起 来 没有 问题 , 但 是 却 存 在 一 些 数 , 对 于 A Ay sce ve ETE] EE 9g 8T DL Bn ACRI 
i. — AAEE RIRE Carmichael 数 ， 这 些 数 不 是 素数 ,可 是 对 所 有 与 N 互 索 的 0<A<N 
加 满足 AY-! 二 1 (mod N); 最 小 的 这 样 的 数 是 561。 因 此 ， 我 们 还 需要 一 个 附加 的 测试 来 改 
PEAS BG FR ILS 
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在 第 7 了 章 , 我 们 证 明 过 一 个 基于 平方 探测 (quadratie probing) AYE B. 这 个 定理 的 特殊 情 
况 如 下 : 
定理 10.11 
如 果 PA SURBOCX«P, HBA X21 (mod P) 仅 有 的 两 个 解 为 =1, P - 1. 400. 
证 明 : 
X=] (mod P) BRA X^ -1=0 (mod PO. HEU. (X -1) (X 1220 (mod P). 
HTF PRR. O0CX«P, WIE P SR ERR — D, 或 者 整除 (X+1), 由 此 推 
HEH, 
因此 ,如 果 在 计算 A® mod NI) 的 任 一 时 刻 我 们 发 现 违背 了 该 定理 , ABA SDN A 
不 是 素数 。 如 果 使 用 2.4.4 WO Eu, 那么 我 们 看 到 将 有 几 种 机 会 来 实 规 这 种 测试 ”我们 
修改 执行 对 N 的 求 余 运 算 的 例 程 并 庙 用 定理 10.11 的 测试 ,这 种 方法 在 图 10-62 rp SCRI. 


/* If Witness does not return 1, N is definitely */ 
/* composite. Da this by computing ( A ^ i ) mod N and */ 


/* looking for non-trivial square roots of 1 along the */ 
/* way. We are assuming very large numbers, so this */ 
/* is pseudocode */ 





HugeInt 
Wwitness( Hugelnt A, Hugelnt i, Hugelnt N ) 


{ 
Hugelnt X, Y; 


1f(T == 0) 


rerurn 1; 


X = Witness( A, 7 / 2, N}; 
if X == DY /* Lf MN is recursively composite, stop ui 
return 0; 


/* N is not prime if we find a non-trivial root of 1 "/ 
* {X * KM AN; 
if( Y -2 1 && X f= 1 && X Ie N - 1) 

return Ü; 


if( i%2 t= 0) 
Y2(A* YOXN; 


return Y; 


} 


/* IsPrime; Test if N >= 3 is prime using one value = 
/* of A. Repeat this procedure as many times as needed */ 
/* for desired error rate */ 


int 
IsPrime( Hugeint N ) 
{ 
return Witness( RandInt( 2, M- 22, N- 1, N j) = 1; 
} 





图 10-62 ”一 -种 概率 素性 测试 算法 


我 们 知道 ,如果 函数 Witness 返回 任何 不 四 1 的 数 , 那么 它 就 已 经 证 明了 N 不 是 素数 ， 
其 证 明 是 非 构造 性 的 , 因为 它 并 没有 具体 给 出 找到 因子 的 方法 。 业已 证 明 . 对 于 任何 { 充分 大 
HN, 至 多 有 A 的 (N -9)/4 个 值 会 使 该 算法 得 出 错误 的 结论 。 因此 ， 如 果 A 是 随机 选取 
的 ,而 月 算法 的 结论 是 N (很 可 能 ) 为 素数 , 那么 至 少 有 75% B5 0] LEE TE RE IE GR BO. ew RE 
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Witness 运行 50 次 , 则 算法 得 出 错误 结论 的 概率 是 子 。 因 此 ,50 次 独立 的 随机 试验 使 算法 出 
的 概率 绝 不 会 超过 1/49 = 2-799, 实际 上 这 是 非常 保守 的 估计 , 它 只 对 N 的 某 些 选择 成 
六 .即使 如 此 ， 人 们 更 可 能 看 到 的 是 硬件 的 错误 , 而 不 是 对 于 数 的 素性 的 不 正确 的 宣布 结果。 


10.5 BRS 


我 们 将 要 考查 的 最 后 -- 个 算法 设计 技巧 是 回潮 (backtracking) 算 法 . FIPS, DH 
算法 相当 于 穷 举 搜 索 的 巧妙 实现 , 但 性 能 一 般 不 理想 。 不 过 . 情况 并 不 总 是 如 此 ， 即 使 如 此 ， 
在 某 些 情形 下 它 相 比 蛮 力 {brute force FW, LRA BATA. 当然 , 性 能 是 由 对 
的 : 对 于 排序 而 言 ，D CN?) 的 算法 是 相当 差 的 , 但 对 旅行 售货员 (或 任何 NP 完全 ) 问 题 ， 
COON? ) 算 法 则 基 里 程 碑 式 结 冬 ， 

ql 潮 算 苇 的 一 个 具体 例子 是 在 一 套 新 房子 内 摆 放 家 有 具 的 问题 。 存 在 许多 可 能 的 尝试 , 但 
一 般 只 有 一 些 是 具体 要 考虑 的 。 开 始 什么 也 不 摆 放 , 然后 是 每 件 家 具 被 摆 旋 在 室内 的 茶 个 妆 
分 如 果 所 有 的 家 具 都 已 抒 好 而 旦 户主 很 满意 , 那么 算法 终止 - RBA SY, 该 步 之 后 
的 所 有 家 具 氛 放 方 法 都 不 理想 ,那么 我 们 必须 机 销 这 一 步 半 尝试 该 步 男 外 的 舞 放 方法 . U 
5k. 这 也 可 能 导致 另外 的 撤销 , 等 等 。 如 果 我 们 发 现 我 们 撤销 了 所 有 可 能 的 第 一 步 摆 放 位 置 ， 
那么 就 不 存在 满意 的 家 其 摊 放 方法 . 否则 , 我 们 最 终 将 终止 在 满意 的 摆 放 位 置 上 - 注意 . R 
然 这 个 算法 基本 上 是 蛮 力 的 , 但 是 它 并 不 直接 尝试 所 有 的 可 能 . 例如 , E TEE TERCER ET 
的 各 种 摆 法 是 绝 不 会 尝试 的 。 许 多 其 他 坏 的 摆 放 方 法 嘻 就 取消 了 , 因为 令 人 讨厌 的 摆 放 的 子 
华 是 知道 的 . 在 一 步 内 删除 一 大 组 可 能 性 的 做 法 叫做 栽 前 (pruning)。 

我 们 将 看 到 回 湖 算法 的 两 个 例子 - 第 -个 是 计算 史 何 中 的 问题 ， 第 二 个 例子 毅 述 在 请 如 
[8 Ey. Se FCRI DE E EC A EE n nn fap ERI TL ER D I] 8 
10.5.1 收费 公路 重建 问题 

设 给 定 N 个 点 bp Prec bye 它们 位 于 x Hb. r, Bp, 点 的 x Bin. 进一步 假 区 
c S 0D EXE AME SUG ES E, xx N 个 点 确定 在 每 一 对 点 间 的 NCN 一 1 人 2 个 (不 必 丰 惟 : 
的 ) 形 如 | -ae GAER. 显然 如果 给 定点 集 , 那么 容易 以 OCNTODUE TRE FH BIG SED 
EO., 这 个 集合 将 不 是 排序 的 , 得 是, 如果 我 们 愿意 花 OC N?log N) 时 间 界 整理 , HB Ai enn 
离 也 可 以 被 排序 .收费 公路 重建 问题 {turnpike reconstruction problem) f& M cue ih Eg BE 39 TAL s 
一 个 点 集 。 它 在 物理 学 和 分 子 生物 学 (参见 为 更 专门 的 信息 提供 线索 的 参考 文献 ) 中 都 有 应 
用 ,这 个 名 称 得 自 于 对 美国 西海 岸 公路 上 那些 收 税 公路 出 口 的 模拟 。 正 像 天 数 分 解 比 乘 法 轴 
礁 一 样 , 重建 问题 也 比 建造 问题 困难 。 没 有 人 能 够 给 出 一 个 算法 以 保证 在 多 项 式 时 间 户 完成 
计算 我 们 将 要 介绍 的 算法 -- 般 以 DCN2log N) 运 行 , 但 在 最 坏 情 形 下 可 能 要 化 费 指 数 时 间 

当然 ， 苦 给 定 该 问题 的 一 个 解 , 则 可 以 通过 对 所 有 的 点 加 上 一 个 偏 移 量 而 构建 无 穷 多 其 
他 的 和解 .这 就 是 为 什么 我 们 一 定 要 将 第 … 个 点 置 于 0 处 以 及 构建 解 的 点 集 以 非 降 顺 片 条 出 的 
ARES. 

A D BA, 并 设 , DI = M- NUN -1 作为 例子 、 说 

D=11, 2, 2, 2, 3,3, 3, 4, 5, 5, 5, 6, 7, 8, 101 

4) | =15, 因此 我 们 知道 N 6. 算法 以 置 ?1 70 Fi BM, r510, AX 104 

D 中 最 大 的 元 素 。 将 10 从 D 中 删除 , RIISER SURE RE S SF Bs. 
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D-311,2,2,2,3,3,3,4, 5, 5, 5,6, 7, 8: 
d RESgERESHUECAB ES, 这 就 是 说 , 要么 r= 2, 要 人 么 rs=8。 几 对 称 忻 ,我 们 可 以 断 
定 这 种 选择 是 不 重要 的 ,因为 要 么 两 个 选择 都 引 何 解 (它们 互 为 镜像 ),， 要 人 么 都 不 会 引 癌 最 终 
的 解 ， 所 以 我 们 可 置 xs =8 而 不 至 于 影响 问题 的 解 : 然后 从 DPR BER ar, 0-2 Hl 
ts- 2, =8, 得 到 


ty = Ü X4 = 8 Xe = 10 
D211,2.2,3,3,3,4,5,5,5,6, 7° 
下 一 步 是 不 明显 的 . 由 于 了 是 了 中 最 大 的 数 , AES 4-77, BZ = 3, WE r457, 
那么 距离 reg-7=3 利 rs-7=1 也 必须 出 现在 DD 中 , 我 们 一 看 便 知 它们 确实 在 DP. AR 
方面 ， 如 果 我 们 置 r53, 那么 3 一 +1=3 和 x 一 3=5 ROME D 中。 REE WME D 
rp. 办 此, 我 们 不 对 哪 种 选择 做 强求 。 这 样 , 我 们 尝试 其 中 的 一 种 看 是 省 它 导 至 问 题 的 解 如 
SUC. 那么 我 们 退回 来 天 尝试 另外 的 那个 选择 。 尝试 第 一 个 选择 我 们 外 rz4=?， 得 色 


x, = 0 X4 = 7x; = 8 xa = 10 
D=:2, 2,3.3, 4,5,5,5, 61 


此 时 , 我 们 得 到 7,50, 4-7, r57 8 Hl x, 7 10. 现在 最 大 的 距离 是 6. 因此 要 么 r356, 
BA 2574, 但 是 , 如 果 r356, 那么 za- rid. 这 是 不 可 能 的 ， 因为 1 不 再 属于 D.5-- 
Ad. 如果 7.274, BA ro- eg a4 A rs- 0274, 这 也 是 木 可 能 的 , 因为 4 Re DHEN 
一 次 。 因此 , 这 个 推导 思路 得 不 到 解 ,我 们 需要 回潮 。 

由 于 r,=7 不 能 产生 解 , 因此 我 们 尝试 x; =3。 如 果 这 也 不 行 , BARMERA 
告 无 解 . 现在 , 我 们 有 


x, = 9 xx = 3 xs = 8 x, = 10 
D=}1, 2,2, 3, 3.4, 5, 5. 6! 
我 们 必须 再 一 次 在 2g = 6 和 zs=4 之 问 选 择 。rs=4 是 不 可 能 的 , AAD 只 出 现 一 个 4， 
面 该 选择 意味 着 要 有 两 个 。x4 =6 是 可 能 的 , 于 是 我 们 得 到 


———————————— 


x, = 0 xy = 3 x4 = 6 x, = 8 x, = 10 
H= 11, 2. 3, 5. 5i 
MERIT RHET r;= 5, 这 是 可 以 的 , 因为 它 使 得 DD 成 为 空 集 ,因此 我 们 得 到 问题 的 一 个 解 。 





图 10-63 是 一 棵 决策 树 , 代表 为 得 刘 解 而 采取 的 行动 。 这 里 , RERA X A IEEE. 
而 是 把 标记 放 序 了 分 支 的 目的 节点 上 。 带 有 一 个 是 号 的 节点 表 不 这 些 所 选 的 上 53 26 E VOD EI 
不 - : 敏 ; 带 有 两 个 星 号 的 节点 只 有 将 不 可 能 的 节点 作为 儿子 节点 , 因此 表示 一 条 不 正确 的 
路 径 ， 





图 10-63 收费 公路 重建 问题 的 决策 树 


空 现 这 个 算法 的 伤 代码 大 部 分 部 很 简单 。 驱动 例 程 Turnpike 如 图 10-64 所 示 . CREM 
AER X( 不 需要 初始 化 ), 距离 的 数组 D 和 NN. 呈 如 昌 找 到 一 个 解 ， 则 返回 true, BHR 
al XX 中 ,而 也 将 是 空 集 。 否则 , 返回 fale, 和 将 是 未 定义 的 , 距离 数组 将 是 木 触及 的 。 该 例 
程 旭 上 所 述 给 r ryf zw ET., 修改 了 了, 并 且 调 用 了 回潮 算法 Place 以 放置 其 余 的 
点 。 我 们 假设 为 保证 | Di = N(N -1)/2 已 经 进行 检验 。 










int 
Turnpike( int X[ J, DistSet D, int N ) 
1 


= 1*/ X[ 1] = 0; 
/* ij XE N ] = DeleteMax{ D >; 
f* 37 XE. N - 1] = DeleteMax( D }; 
fe A&P if XEN] - XEN -1L]€ D} 
i 
/* Dw Removet XL N ] - XLN - 1], D); 
/* Bi return Placet X, D, N, 2, N- 2 3; 
1 
else 
fe Fes return False: 


图 10-64 “收费 公路 重建 算法 ; 驱动 例 程 ( 伪 代 码 ) 





， 为 使 所 举 的 例子 方便 起 岂 , 我 们 使 用 了 音 宁 尽 变 量 各， 一 般 说 来 这 不 是 好 习惯 ,为 了 简单 . Pelih AAH EEA 
类 型 。 
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更 国难 的 部 分 是 回 测算 法 ， 如 图 10-65 所 示 , 5i X CIR REM FE. 最 方便 的 实现 方 
法 是 递归 . 我 们 传递 同样 的 参数 以 及 界 Left 和 Right ;rien ， AR 是 我 们 试图 放置 的 点 的 
r 坐标 。 如 果 是 空 集 (或 Left > Right), 那么 解 已 经 找到 ,我 们 可 以 返回 ,。 否则, 我 们 首先 党 
斌 使 zs 三 只 。 如 果 所 有 适当 的 距离 都 (以 正确 的 值 ) 出 现 , 那么 尝试 性 地 放 上 这 一 点 , 删除 
这 些 距 离 , 并 尝试 从 Left 到 Right — » SAL. 如 果 这 些 距离 不 出 现 , BEAM Left 到 Right — 1 HA 
入 尝试 失败 ,那么 我 们 尝试 置 cup = xw dn 使 用 类 似 的 方法 。 如 果 这 样 不 行 . 则 问题 无 
解 ; 否 则 , 一 个 解 已 经 找到 , 而 这 个 信息 最 终 通 过 return 语句 和 X 数组 传递 回 Turnpike. 





/* Backtracking algorithm to place the points */ 
/* X[ Left ... Right ] */ 

/* XL 1... Left - 1] and XE Right + 1 ... N ] */ 
/* are already tentatively placed */ 

/* If Place returns True, */ 

/* then X[ Left ... Right J will have values */ 


int 
Place( int X[ ], BistSet D, int N, int Left, int Right ) 


int DMax, Found - False; 


/* 1*/ if€ D is empty ) 
/* 2*/ return True; 
/* ài*/ DMax = FindMax( D 2; 


/* Check if setting X[ Right ] = DMax 7s feasible */ 
/* 4*/ if(| XE j ] - Dax | € D 
for all 1 = j < Left and Right « j =N) 
{ 


J* Su XI Right j = DMax; /* Try XE Right j = DMax */ 

/* 67/ for( 1 = j < Left, Right <j = ND 

fn Fe Deletet | XE j ] - DMax |, D X: 

/* oY ift !Found ) /* Backtrack */ | 
/*10*/ for( 1 = j « Left, Right < 了 


= HJ /* Undo deletion */ 
/*1l*/ Insert( | X[ j ] - DMax |, D 3; 
t 


/* If first attempt failed, try to see if setting rd 
/* X[ Left ] = XL N ] - DMax is feasible */ 


l 
y* B*/ Found = Place( X, D, N, Left, Right - 1 }; 


f[*12*/ if( !Found && ( | XL NJ - DMax - XL 351! & G 

f/*13*/ for all1 = j « Left and Right « j = W ) ) 
{ 

/*14*/ X[ Left ] = X[ N 1 - DMax; /* Same logic as before */ 

/*15*/ for( 1 = j < Left, Right « j = NJ 

f*16*/ Delete | X[ N J - OMax - X[ 3 1 |. 0 3; 

/*l7*/ Found = Place( X, D, N, Left + 1, Right 2; 


f*18*/ if( !Found ) /* Backtrack */ 
/*19*/ for( 1 = j < Left, Right < j = 
/*20*/ Insert( | XL N ] - DMax - XI j 


} 
/*21*/ return Found; 





图 10-65 收费 公路 重建 算法 ; 回潮 的 步骤 ( 伪 代 码 ) 


算法 的 分 析 涉及 两 个 因素 。 设 第 9 行 到 第 11 行 以 及 第 18 行 到 第 20 FARAT. RIE 
以 把 D 作为 平衡 二 叉 查 找 (或 伸展 ) 树 保存 (当然 ， 这 需要 对 代码 做 些 收 改 )。 如 果 我 们 从 未 回 
Me EZ RU ON METER D, 如 在 第 4 行 . 第 1 到 13 行 中 蕴 售 的 删除 和 Find. t 
然 这 是 对 删除 提出 的 , 因为 D 有 O(N?) 个 元 素 而 没有 元 素 被 重新 搞 人 。 每 次 对 Place 的 调用 


A — = 
— mamm —— 
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最 多 用 到 2N 次 Find, 而 由 于 Place 在 该 分 析 中 从 未 问 滴 ,因此 最 多 可 以 有 2N” 次 Find. 于 
AL, 如果 设 有 回潮, 那么 运行 时 间 为 ON og N)。 

HA, HAERE. WEIMER, 那么 算法 的 性 能 就 到 受到 影响 .我们 可 以 
通过 构建 病态 的 情形 人 迫使 它 发 生 . 经 验证 明 , 如 果 点 的 整数 坐标 在 0，PD, |] 均匀 地 和 随机 地 
分 布 ， 其 中 D, = O(N), 那么 在 整个 算法 期 间 几 平 肯 定 最 多 执行 - -次 所 潮 。 

10.5.2 (ax 

作为 最 后 一 个 应 用 , 我 们 将 考虑 计算 机 用 来 进行 战略 游戏 的 策略 ,如 西洋 跳棋 或 国际 人 象棋、 
作为 一 个 例子 ， 我 们 将 使 用 简单 得 多 的 三 连 游 戏 棋 (tic tactoe) 游 戏 ,， 因 为 它 使 得 想法 更 容易 表述 。 

如 果 双 方 部 玩 到 最 优 , 那么 三 连 游 戏 棋 就 是 平局 。 通 过 进行 任 细 的 逐个 情况 的 分 机 , 构 
造 -个 从 不 输 棋 而 且 当 机 会 出 现时 总 能 访 棋 的 算法 并 不是 困难 的 事 - 这 所 以 能 够 做 到 是 因为 
一 些 倍 置 是 已 知 的 陷阱 , 可 以 通过 查 表 来 处 理 - 另外 一 些 方法 , 如 当中 央 的 方 格 可 用 时 占据 
该 方 格 , 可 以 使 得 分 析 更 简单 。 如 果 完 成 了 分 析 , 那么 通过 使 用 一 个 表 我 们 总 十 以 只 根据 当 
前 位 置 选 择 一 步 供 . 当然 , 这 种 方法 需要 程序 员 而 不 是 计算 机 来 进行 大 部 分 的 思考 ， 

极 小 极 大 策略 

ip 一 般 的 策略 是 使 用 -- 个 赋值 函数 来 给 一 个 位 置 的 “好 坏 ” 定 值 . 能 使 计算 机 获胜 的 位 
置 可 以 得 到 值 + 1; 平 局 可 得 到 0; 使 计算 机 输 祺 的 位 置 得 到 值 - 1。 通过 考察 盘 而 能 够 硼 定 这 
局 棋 输 赢 的 位 置 叫 司 终 端 位 置 (terminal position) 。 

如 果 一 个 位 置 不 是 终端 位 置 , 那么 该 位 置 的 值 通过 递 时 地 根 设 双方 最 优 棋 步 而 确定 。 这 
山谷 极 小 极 大 (minimax) 策 略 ， AA TER - 方 ( 人 ) 试 图 使 这 个 位 置 的 值 极 小 化 ， 而 号 A 
(计算 机 ) 却 要 使 它 的 值 极 大 ， 

(E P BE BEI X (successor position) EAGLA P 走 一 步 棋 可 以 达到 的 任何 位 置 P， 如 
果 妆 在 某 个 位 置 P 计算 机 要 走 棋 , 那么 它 递归 地 求 出 所 有 的 后 继 位 置 的 值 。 计算 机 选择 具有 
最 大 值 的 -步行 棋 , 这 就 是 了 的 值 ; ATSB Re P. THE. 要 递归 地 算出 已 的 所 
有 后 继 位 置 的 值 ， 然 后 选取 其 中 最 小 的 值 . 这 个 最 小 值 代 表 行 横 人 一 方 最 赞成 的 应 描 。 

图 10-66 中 的 程序 使 得 计算 机 的 策略 更 清楚 , 第 1 行 到 第 4 行 直接 给 赢 棋 或 平局 赋值 . 
如 果 这 两 个 情况 都 不 适用 , 那么 这 个 位 置 就 是 非 终 端 位 置 。 注意 到 Value 应 该 包括 所 有 可 能 
后 继 位 置 的 最 大 值 , 第 5 行 把 它 初始 化 为 最 小 的 可 能 值 , 第 6 行 到 第 13 行 的 循 坏 则 为 了 改进 
而 进行 搜索 。 每 一 个 后 继 位 置 递 归 地 依次 由 第 8 到 第 10 行 算 出 值 来 。 因为 我 们 将 看 到 过 程 
FindHumanMove 调用 FindCompMeve, 所 以 这 是 递归 的 。 如 果 下 横 人 对 一 步 棋 的 应 招 给 计算 
机 留 下 比 计算 机 在 前 面 最 佳 棋 步 所 得 到 的 位 置 更 好 的 位 置 , 那么 Value 和 BestMove E 
新 。 图 10-67 Son dé TEARRE. 除了 下 棋 人 选择 的 棋 步 导致 最 低 值 的 位 置 
外 ,所 有 的 有 逻辑 实际 上 部 是 相同 的 . 事实 上 ， 遂 过 传递 一 个 额外 的 变量 不 难 把 这 两 个 过 程 分 
并 成 一 个 , 这 个 额外 变量 指出 该 谁 走 棋 。 这 样 一 来 确实 使 得 程序 多 少 有 些 难于 读 民 了, TA 
我 们 就 停留 在 两 个 分 开 的 例 程 的 阶段 。 

下 于 这 上 防 个 例 程 必须 要 传 回 位 置 的 值 和 最 住 的 棋 步 ， 因此 我 们 通过 使 用 指针 米 传递 将 得 
到 这 些 信 息 的 两 个 变量 的 地 址 。 现在 ， 最 后 的 两 个 参数 现在 回答 的 就 不 是 “是 什么 ” 而 是 “在 
HB" T. 

作为 一 个 例子 , 在 图 10-66 中 BestMove 包 会 可 以 放置 最 佳 棋 步 的 地 址 。FindCompMove 
通过 访问 x BestMove 可 以 考查 或 修改 这 个 地 址 中 的 数据 。 第 9 行 指出 主 调 例 程 应 该 怎样 运 
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f. BET FARE THE A AH BUE, 而 FindHumanMove HE xt SRA HOHE , 
因此 这 里 用 到 了 地 址 操作 符 & ~ 










/* Recursive procedure to Find best move for computer */ 
/* SestMove points to a number from 1 to 9 indicating square */ 











/* Possible evaluations satisfy CompLoss < Draw < Compwin */ 
/* Complementary procedure FindHumanMove jis Figure 10.67 */ 
/* Board is an array and thus can he changed by Placa */ 


void 
FindCompMove( BoardType Board, int *BestMove, int “Value ) 
{ 


int Dc, 7, Response; /* Dc means don't care */ 


/* l*/ ift FullBoard( @oard ) 3 
f* 2*/ "Value - Draw; 
else 
/* 3*/ ifi ImmediateCompwin( Board, BestMove ) ) 
/* 4*/ *Value = Compwin; 
else 
{ 
/* 5*/ *Value = Compioss; 






for(i = 1; i <= 9; i++ ) /* Try each square */ 







if( IsEmpty( Board, i ) ) 
{ 






Place( Board, i, Comp 3; 
f* 9*/ FindHumanMavetc Board, &Dc, &Response 3; 
Unplace( Board, i 3; /* Restore Board */ 






if( Response > *Value ) 






/* Updare best move */ 
/*1à*/ *Value = Response; 
/*13*/ *BestMove = i; 








E 10-66 极 小 极 大 三 连 游 戏 模 算法 : 计算 机 的 选择 


如 果 在 第 9 行 不 用 操作 符 &. 并 且 Dc 和 Response 均 为 零 ( 这 是 典型 的 未 初始 化 数据 ), AB 
4 FindHumanMove 将 试图 把 最 佳 模 步 和 位 置 值 放 到 内 存 位 置 零 处 . 当然 ,这 不 是 我 们 想 归 的 ， 
并 将 几乎 肯定 导致 程序 崩溃 ( 试 一 试 !)。 这 是 在 使 用 库 函 数 中 的 scanf 族 函 数 时 最 常见 的 错误 。 

我 们 把 -一些 支持 例 程 留 作 一 道 练习 题 。 代 价 最 高 的 计算 是 需要 计算 机 开局 的 情形 。 由 于 在 
这 个 阶段 棋局 处 于 平局 的 形势 , 因此 计算 机 选择 方 格 1.2 需 要 考查 的 位 置 总 共有 97 162 个 ， 计 
算 要 花费 几 秒 ,。 没有 优化 程序 的 打算 。 如 时 下 横 人 选择 中 央 方 格 , 那么 当 计 算 机 走 第 二 步 嵌 的 
sif, 所 要 考查 的 位 置 的 个 数 是 5185 个 ,当下 棋 人 选 样 一 个 角 上 的 方 格 时 , 计算 机 所 要 考查 则 
位 置 是 9761 个, 而 当下 棋 人 选择 非 角 的 边 上 的 方 格 时 计算 机 要 考查 13 233 个 位 置 。 

对 于 更 复杂 的 游戏 , 如 西洋 跳棋 和 国际 象棋 , 搜索 到 终端 节点 的 全 部 棋 步 显然 是 不 可 行 
的 ,在 这 种 情况 下 , 我 们 在 达到 递归 的 某 个 深度 之 后 只 能 停止 搜索 。 递归 停止 处 的 节点 则 成 

5 我 们 将 方 格 从 棋盘 左上 角 开 始 向 古 编号, 不 过 , 这 只 对 支持 例 程 是 重要 的 。 
= Akt. BUM FREER, 那么 对 于 第 - 步 棋 至 少 有 10Im 个 位 置 需要 考查 。 即使 是 本 节 稍 后 描述 的 改 


V 


进 方法 结合 使 用 , 这 个 数字 志 不 能 妖 低 到 实用 的 水 平 。 
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为 终端 节点 。 这 些 终端 节点 的 值 由 一 个 属 计 位 置 的 值 的 函数 计算 得 出 - 例如 , EP E 
IFF, 求 值 消 数 计 其 诸 如 棋子 和 位 置 肉 素 的 相对 里 和 强度 这 样 一 些 变 量 。 OR OT Fa 
是 至 关 重 要 的 ,因为 计算 机 的 行 棋 选 步 是 基于 将 这 个 函数 极 大 化 。 最 好 的 计算 机 下 棋 程 序 的 
AR FR OR Bet A nO RE 2S 












void 
FindHumanMove( BoardType Board, int *BestMove, int “Value ) 
{ 

int Dc, i, Response; /^ De means don't care */ 


} 


fe 1*7 Fi FullBoard( Board 3 3} 
| f= 2*/ *Value - Draw; 
| else 
A 3*/ ift ImmediateHumanwin( Board, BestMove ) ) 
| ft qe? *Value = CompLoss; 
else 
| 1 
/* ary "Value = Compwin; 
| y* Gr for( i = 1; ) «= 9; i++ ) /* Try each square */ 
i 
| fe Y*f ift IsEmpty( Board, i ) 3 
i 
/* B*/ Place( Board, 1, Human 3; 
/* 8*7 FindCampMove( Board, &0c, &Response 5; 
/*10*/ Unplace( Board, i 3; /* Restore board */ 
/*11*/ iff Response < *Value ) 
了 
/* Update best move */ 
/*12*/ *Value = Response: 
/*13*/ *BestMove = 1; 





10-67 HR-MEASFEDRRELER: 人 的 选择 


然而 , 对 于 计算 机 下 棋 , -SRE EKARA KEAT RESET) aM Oa. TH 
我 们 称 之 为 层 (ply); 它 等 于 递 妇 的 深度 。 为 了 实现 这 个 功能 , 需要 给 予 搜索 例 程 一 个 额外 的 

在 对 弈 程序 中 增加 向 前 看 步 因 素 的 基本 方法 是 提出 一 些 方法 , 这些 方法 对 更 少 的 节点 求 
HEATERS., 我 们 已 经 看 到 的 一 种 方法 是 使 用 一 个 表 来 记录 有 所 有 已 经 被 计算 过 值 
的 位 置 。 例 如, 在 搜索 第 一 步 棋 的 过 程 小 , 程序 将 考查 图 10-68 中 的 一 些 位 置 。 如 果 这 些 位 
VHS I. 一 全 位 置 在 第 二 次 出 现时 就 不 必 再 重新 计算 ; 它 基本 上 变 成 了 一 个 终 
端 位 置 。 记 录 这 些 信息 的 数据 结构 叫做 置换 表 (transposition table) ; 它 儿 乎 总 可 通过 散 列 来 实 
现在 许多 情况 下 , 这 可 以 节省 大 量 的 计算 例如 , 在 一 盘 棋 的 最 后 阶段 ， 此 时 相对 来 说 只 有 
很 少 的 棋子 , 时 间 的 节省 使 得 一 步 搜索 可 以 进行 到 更 深 的 者 下 层 。 
a-p 裁剪 

人 省 ] 一 般 能 够 取得 的 最 重要 的 改进 称 为 aB AY (aB pruning}. 图 10-69 hizk4E— 3E 

查 的 棋局 中 用 来 给 某 些 某 个 假设 的 位 置 求 值 的 一 些 递归 调用 的 迹 。 3B 38 ix 0] (ir — 99 E SE nr 
(game tree)。( 到 现在 为 正 我 们 一 直 回避 使 用 这 个 术语 ， 因为 它 和 多 少 有 些 令 人 误解 : UB 
由 该 算法 具体 构造 的 , 博弈 树 只 是 一 个 抽象 的 概念。 ) 这 棵 博弈 树 的 值 为 44。 
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图 10-70 BRR MR, CAE ARAN ILE AE SR TIS 
没有 被 检验 。 我 们 证 明 计 算 它们 的 值 将 不 改变 树 很 的 值 。 





图 10-70 “一 棵 被 裁减 的 搏弈 树 


首先 , 考虑 节点 万。 图 10-71 显示 在 给 D 求 值 时 已 经 搜集 到 的 信息 。 此 时 , 我 们 仍然 处 
£t FindHumanMove 中 并 正在 打算 对 D 38H FindCompMove. 然而 , 我 们 已 经 知道 FindHu- 
manMove 最 多 将 返回 40, 因为 它 是 一 个 min 节点 。 男 一 方面 , ER max d uS ap 
证 一 个 保证 44 的 顺序 。 注意 ， D 无 论 如 何 也 不 可 能 增加 这 个 值 。 因 此 ，P 不 需要 求 值 。 该 树 
的 这 个 裁减 叫做 裁减。 同样 的 情况 出 现在 节 BB。 为 了 实现 0 裁减 . FindCompMove HE 
尝试 性 的 极 大 值 (fo 传递 给 FindHumanMove. 如 果 FindHumanMove 的 党 试 性 的 概 小 值 低 于 
这 个 值 , 那么 FindHumanMove 立即 返回 。 


| 32 | # 10% 





10-71 标记 “* 委 的 节点 是 不 重 邓 的 


ail, 类 似 的 情况 也 发 生 在 节点 A AIC XR, 我们 在 FindCompMove 的 中 间 ， # HF 98] 
un 用 FindHumanMove 以 计算 C 的 值 . 图 10-72 显示 在 节点 CC 过 到 的 这 种 情况 。 人 不过, HAAS 
Bl FindCompMove 的 FindHumanMove TE min JEE, 已 经 确定 它 能 够 迫使 一 个 值 最 高 到 44( 注 
音 , 对 于 下 模 人 这 一 方 低 的 值 是 好 的 )。 由 于 FindCompMove 有 一 个 尝试 性 的 最 太 值 68. 因此 
C 在 min 层 上 怎么 做 也 不 会 影响 到 这 个 结果 。 因 此 ，C 不 应 该 求 值 - 这 种 类 型 的 裁减 叫做 8 

裁减 ; 它 是 a 裁减 的 对 称 形 式 。 当 两 种 方法 结合 起 来 时 我 们 得 到 a-p RM. 





图 10-72 标记 “9?” 的 节点 是 示 重 要 的 


实现 o-p 裁 碱 所 需 代码 少 得 惊人 - 图 10-73 显示 的 是 a-B 裁减 方案 的 一 半 { 减 去 类 型 说 
明 )。 你 应 该 能 够 写 出 另 一 半 代 码 而 不 会 遇 到 任何 麻烦 。 

为 了 充分 利用 vB 裁减 , 对 弈 程序 通常 尽量 对 非 终端 节点 应 用 求 值 画 数 , 力图 把 最 好 的 
祺 步 早 一 些 放 到 搜索 范围 内 。 这样 的 结果 甚至 比 人 们 从 随机 顺序 的 节点 所 期 望 的 裁减 还 要 裁 
减 得 多 。 其 他 一 些 方法 , 像 以 积极 的 方式 进行 更 深入 的 搜索 也 在 使 用 。 

在 实践 中 ,a8 裁 碱 把 搜索 限制 在 只 有 OC N) 个 节点 上 , 这 里 N 是 整个 博弈 树 的 大 小 。 
六 足 巨大 的 节约 , 它 意味 着 使 用 aB 裁 威 的 搜索 与 非 裁减 树 相 比 能 够 进行 到 两 倍 的 深度 我 
们 的 兰 连 游戏 横 例 子 是 不 理想 的 ， 因 为 存在 太 多 相同 的 值 ， 但 即使 是 这 样 ， 最 初 对 97 162 个 
节点 的 搜索 还 是 被 碱 到 了 4 493 个 节点 (这 些 计 数 包括 非 终端 节 上 总 )。 

在 许多 对 弈 领域 , 计算 机 跻身 于 世界 最 优秀 弈 者 之 列 。 所 使 用 的 方法 是 非常 有 趣 的 ,而 
月 可 以 应 用 到 一 些 更 严肃 的 问题 上 。 更 多 的 细节 可 见 参 考 文献 。 
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/* Same as before, but perform alpha-beta pruning */ 
/* The main routine should make the call with */ 
/* Alpha = CompLoss and Beta = Compwin */ 


| void 
FindCompMovet BoardType Board, int *BestMove, int *value, 
int Alpha, int Beta } 


int Dc, i, Response; /" Dc means don't care */ 


/* l*/ ift FullBoard( Board ) ) 
f* vy "Value = Draw; 
else 
fv yy if{ ImmediarteCompwin( Board, BestMove 3} 3 
f* 4*/ *Value = Compwin; 
else 
i 
/? gy Value = Alpha: 


/* for( 1 = 1; 1 «2 9 && *Value « Beta; i++ ) 





{ 
fe Pf if( IsEmpty( Board, 1 } ) 
i 
/* B" Place( Board, i, Comp 2: 
/? g*/ FindHumanMovet Board, &Dc, &Response, 
‘Value, Beta »: 
/*l0*/ Unplace( Board, i 2; /* Restore board */ 


Pa ift Response > “Value ) 





/* Update best move */ 
/512*/ "Value - Response; 
/*13*/ *BesrMove = 1; 








10-73 E o PRR IR AS ERE: 计算 机 棋 步 的 选择 


ole 

x — EGET EA PRAM ERK. STR, EA 
间 考 察 一 下 这 些 方法 能 否 适 用 是 值得 的 。 算 法 的 适当 选择 , 结合 数据 结构 的 审慎 使 用 , 常常 
能 够 迅速 导致 问题 的 高 效 解决 。 


练习 
10.1 WE AERE A Zi eae LER FERN R ME 
10.2 WEE d, jo o UN 为 输入 ， 其 中 的 每 一 个 作业 都 要 花 一 个 时 间 单 位 来 完成 。 如 
果 每 个 作业 ; 在 时 间 限 度 ， 内 完成 , 那么 将 挣 得 d; 美元 , 但 若 在 时 间 限 度 以 后 抑 
p NT AS SUE 
a, 给 出 一 个 O(N?) 贪 禁 算 法 求解 该 问题 . l 
。 ,修改 你 的 算法 以 得 到 O(N log N) 的 时 间 界 。 提示 : 时 间 界 完全 归 因 于 将 作业 
按照 金额 排序 。 算 法 的 其 余部 分 可 以 使 用 不 相交 集 数 据 结构 以 CN log N) 
3:9. 
10.3 OAA F Fi dear m. 空格、 换行 (newline)、 刘 号 和 数字 ; 冒号 (100)， 
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10.23 
10.24 


* *h. 


ZGOS), HRTTCIOUD, 1247 ( 705), 01431), 1(242), 20176), 3059), 4(185), 5 
(250), 6(174), 7(199), 8(205), 9(217)。 构 造 其 Huffman Set 

编码 文件 有 一 部 分 必须 是 指示 Huffman WARF. E816 AERA 
EH OUN) 的 文件 头 ( 除 符号 外 ) ,其 中 是 符号 的 个 数 。 

证 明 Huffman 编码 生成 最 优 的 前 缀 码 。 

证 明 : 如 果 符 号 是 按照 频率 排序 的 , 那么 Huffman 算法 可 以 以 线性 时 间 实 更 

用 Hoffman 算法 写 出 -个 程序 实现 文件 庄 缩 4 和 解压 缩 )。 


证 明 : 通过 考虑 下 述 项 的 序列 可 以 迫使 任意 联机 装 箱 算法 至 少 使 用 最 优 箱子 数 : 


N 项 大 小 为 二 一 2e ，N 项 大 小 为 上 +e，N 项 大 小 为 了 + 
解释 如 何以 时 间 OCN log N) 实 现 首次 适合 算法 和 最 佳 适合 算法 ， 
指出 在 10.1.3 节 讨 论 的 所 有 装 箱 方法 对 输入 0.42, 0.25, 0.27,0.07, 0.72, 
0.86, 0.09, 0.44, 0.50, 0.68, 0.73, 0.31, 0.78, 0.17, 0.79, 0.37, 0.73, 
0.23, 0.30 的 操作 。 
编写 一 个 程序 比较 各 种 装 箱 试探 方法 (在 时 间 上 和 所 用 箱子 的 数量 上 ) 的 性 能 。 
证 明定 理 10.7. 
证 明定 理 10.8. 
将 N 个 点 放大 一 个 单位 方 格 中 。 证 明 最 近 一 对 点 之 间 的 距离 为 ON 12). 
论证 对 于 最 近 点 算法 , 在 带 内 的 平均 点 数 是 OC ND. 提示 : 利用 前 -- 道 练 避 的 结 
果 。 
编写 一 个 程序 实现 最 近 点 对 算法 . 
使 用 一 分 化 中 项 的 中 项 方法 , 快速 选择 算法 的 渐 近 运行 时 间 是 多 少 ? 
证 明 七 分 化 中 项 的 中 项 的 快速 选择 算法 是 线性 的 。 为 什么 让 明 中 不 用 七 分 化 中 项 
的 中 项 方法 ” 
实现 第 7 章 中 的 快速 选择 算法 , 快速 选择 使 用 五 分 化 中 项 的 中 项 方法 , 并 实现 
10.2.3 PREKER E. 比较 它们 的 运行 时 间 。 
许多 用 于 计算 五 分 化 中 项 的 中 项 的 信息 都 被 丢弃 了 。 指出 怎样 通过 更 仔细 地 使 用 
这 些 信息 减少 比较 的 次 数 。 
完成 在 10.2.3 节 末 尾 描 述 的 抽样 算法 的 分 析 , 并 解释 8 和 s 的 值 如 何 选择 - 
指出 如 何 用 递归 乘 算法 计算 XY, 其 中 X=1234，Y = 4321。 要 包括 所 有 的 递归 
计算 。 
指出 如 何 只 使 用 三 次 乘法 将 两 个 复数 X —a + bi MY =c + di SEX. 
a. 证 明 

X Yg + XRY, = (Xi t Xg) (YL+ Yr) —XLYL- XpYR 
b. 它 给 出 进行 N- 比 特 的 数 的 乘法 的 O(N1”) 算 法 。 将 该 方法 与 课文 中 的 解法 进 
行 比较 。 
_ 指出 如 何 通过 求解 大 约 为 原 问题 三 分 之 一 大 小 的 互 个 问题 来 完成 喇 个 数 的 区 
ik. 
将 该 问题 推广 得 出 -- 个 OUCNL ERE, HOR >0 为 任意 参数 。 
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10.34 
10.35 
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10.38 


10.39 


c. Æ b 问 中 的 算法 比 OCN log NM? 
为 什么 Strassen 算法 在 2x2 SERS RISE HE (AY Ae EE AY. 
两 个 70 x 70 第 阵 可 以 使 用 143 640 1X3 PE SE. TH d ix An ef Be E HS TF pco d 
Strassen 算法 给 出 的 界 。 
计算 A,A+A;A,45A, 的 最 优 方法 是 作 - 么 ? 其 中 ,这些 矩阵 的 阶 数 为 41: 10 20, 
As: 20X 1, Aa: 1X40, Ag: 40X5, Ag: 5X30, Ag: 30x 15, 
uEHH P FERIA ARETE RK. 在 每 一 步 
a. HARD BHR. 
b. iT SOR ER REB ES 
c. 计算 两 个 矩阵 M; 38M; ,1 之 同 的 乘法 使 得 在 M, 中 的 列 数 最 小 (使 用 上 和 而 法 则 
之 一 )。 
编写 一 个 程序 计算 此 隆 乘法 的 最 佳 硕 序 。 注意 , 程序 要 显示 具体 的 顺序 。 
指出 下 列 单 洱 的 最 优 二 及 查找 树 , 其 中 插 号 内 是 单词 出 现 的 频率 ; (0.18), and 
(0.19), 10.23), (0.215, or(0.19). 
KRR MARES BID DOSES AIR RET. 在 这 种 情况 下 ,由 EA 
EEE vo, << Ww 1 的 单词 W 执行 - -次 查找 的 概率 ， 其 中 IS AN go 是 对 
W« w, 的 单词 W 执行 一 次 查找 的 概率 ,而 qu EAW > ww 执行 一 次 查找 的 概 
iC ;=0, 否则 
C, ,= W,,* min (C, +- it €) 
ik W 满足 四 边 形 不 等 式 (qusdrangle inequality}, 即 对 所 有 的 mS mj. 
Wt Wy, Wy, + Wu 
进一步 假设 WA: Ri RS. MBA OW, Wi. 
a. 证 明 C 满足 四 边 形 不 等 式 。 
b. S R. REC, 1+ Ce, ,达到 最 小 值 的 最 大 的 & (就 是 说 , 在 由 等 的 情形 下 选择 
BAN k). 证 明 : 
R, ;<R,, Jt RR, 541 
c. 证明 R BETTER. 
d. 用 它 证 明 C 中 所 有 的 项 可 以 以 O(N TIE 
e. 使 用 这 些 技巧 可 以 以 O(N?) 解 决 哪个 动态 规划 算法 ? 
编写 一 个 例 程 从 10.3.4 节 中 的 算法 重新 构造 那些 最 短路 径 。 
在 你 的 计算 机 系统 上 考查 随机 数 发 生 器 。 其 随机 人 性 如 何 ? 
编写 在 跳 耻 表 中 执行 插入 、 删 除 以 及 查找 的 例 程 。 
给 出 跳 牙 表 操 作 的 期 望 时 间 为 O(log N) 的 正式 让 明 。 
图 10-74 显示 抛 一 枚 弄 币 的 例 程 ,假设 rand 返回 一 个 整数 (这 在 许 冤 系统 中 党 
见 )。 如果 随机 数 发 生 器 使 用 形 如 M=2 的 模 ( 址 憾 的 是 这 在 许多 系统 上 流行 )， 
AR 2, SEES Bk BR e BEDAE UST EPI PE E UAT? 
a. FREE SEERA 270951 (mod 341). 
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enum CoinSide { Heads, Tails }; 
typedef enum CoinSide CoinSide; 


Coinside 
FIip( void 3 
{ 


iff ( rand( ) X 2 3j 5 0) 
return Heads; 

else 
return Tails: 





图 10-74 APAA T S CERT) 


b. 指出 随机 化 素性 测试 对 于 N = 561 并 伴 有 A 的 多 个 选 拌 是 如 何 工作 的 . 
实现 收费 公路 重建 算法 。 

如 果 两 信 点 集 产 生 相 同 的 距离 溪 合 而 不 彼此 转换 ， 那 么 这 两 个 点 集 称 为 是 同 度 的 
(homometricy。 下列 昨 离 集合 给 出 两 个 不 同 的 点 集 : 11, 2, 3. 4. 5, 6, 7, 8. 9, 
10, 11, 12, 13, 16, 171。 求 出 这 两 个 点 集 。 

扩展 重建 算法 使 给 定 一 个 距离 集合 找 出 所 有 的 同 度 扩 集 。 

指出 图 10-75 中 的 树 的 aG 裁减 的 结 采 。 





10.44 

10.45 

10.46 

- * 10.47 
u 
l 
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图 10-75 “搏弈 树 , DEBERI ARIA 


a. PA 10-73 中 的 程序 实现 a RME p RR? 

b. SMH GFA. 

写 出 tic-tac-toe 棋 剩 下 的 过 程 。 

— # X i 19] 38 (one-dimensional circle packing problem) 4H F : AN 个 半径 分 别 是 
ry roy te ry 的 加 ,将 这 些 贺 装 到 一 个 盒子 中 ， 使 得 每 个 圆 都 与 盒子 的 底 边 相 
切 , 圆 的 排列 按 康 来 的 顺序 。 该 问题 是 找 出 最 小 尺寸 的 盒子 的 宽度 。 图 10-76 最 示 
个 例子 ， 圆 的 半径 分 别 为 2, 1, 2。 最 小 尺寸 盒子 的 宽度 为 4+ 4/2. 

设 无 向 图 G 的 边 满足 三 角形 不 等 式 : cr t co um Cu. wo 指出 恕 何 计算 价 伍 最 多 
为 最 优 路 径 两 售 的 旅行 售货员 游程 。 提示 : 构造 最 小 生成 树 。 

假设 你 是 邀请 赛 的 经 举 , 需要 安排 N=2 Asie gy A [8] — 56 9 BEE robin tour- 
narment)， 在 这 次 邀请 赛 上 ， 每 人 每 天 恰好 打 一 场 比 赛 ;N 一 1 天 后 ， 455 xd GE qn] E 
已 进行 了 比赛 。 给 出 一 个 递归 算法 安排 比赛 。 
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图 t0.76 ” 装 贺 问题 实例 


10.49 +a. 证 明 在 一 轮 罗 宾 六 请 赛 中 总 能 够 以 顺序 p. sb, soo pi 安排 运动 员 使 得 对 耳 
BAIS N, p AAEM p. 的 比赛 。 
b. 给 出 一 个 O(N log N) 算 法 来 找 出 这 样 的 安排 。 你 的 算法 可 以 作为 上 ela) 
的 证 明 。 
«10.50 HEFELE N 个 点 的 集合 P= pis parts pne 个 Voronoi 图 是 将 平面 分 成 N 
MARR 的 一 个 划分 , 使 得 R, 中 所 有 的 点 都 比 P 中 任何 其 他 的 点 都 里 接近 p,。 
图 10-77 显示 十 个 {细心 安排 的 ) 点 的 Voronoi 图 。 给 出 一 个 O(N log NN) 算法 构造 
Voronoi 图 。 





fi 10-77  Voronoi 图 


«10.51. A Bit convex polygon) 是 具有 如 下 性 质 的 多 边 形 : 端点 位 于 多 边 形 .上 的 任意 线 
段 全 部 藩 在 该 多 边 形 中 。 廿 包 (convex huil) 问 题 是 找 出 一 个 将 平面 上 的 点 集 财 往 的 
(面积 ) 最 小 的 凸 多 边 形 。 图 10-78 显示 和 0 个 点 的 点 集 的 凸 包 。 给 出 找 出 吓 包 的 一 
TON log NAE. 





图 10-78 -个 凸 包 的 例子 
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A EE BR VASE PE a. EIR AIRERA ayaa. ay IPR i] 
wu. w 7, wy 组 成 , 我 们 希望 把 它 破 成 长 度 为 上 的 一 些 行 : Hills h E ATE 
陋 , 空白 的 理想 长 度 是 EK), 但 是 空白 在 必要 的 时 候 可 以 伸 长 或 收缩 (不 过 必 
MAF O0), 使 得 一 行 wey pow, 的 长 度 恰 好 是 工 , SA, UPR AR b RT] 
要 装填 i6 — b| > FLA (ugliness point). Ai, 最 后 一 行 是 例外 ,我 们 由 在 xb 
的 时 候 装 填 { 换 句 话 说, 装填 只 在 收缩 的 时 候 进行 ), 因为 最 后 一 行 不 需要 调整 . 这 
BÉ. 如 果 6, 是 在 a; 和 e+ 之 问 的 空白 的 长 度 , 那么 尾 何 一行 (最 后 一 行 除外 ) 
way ye, GP BMERAEEOS S07 ab bl = Gi) lbh), dob oe 
该 行 上 空白 的 平均 大 小 。 RRE b <i RIE. el, 最 后 - 行 根本 不 
a. 给 出 一 个 动态 规划 算法 来 找 出 将 wey, we. oy ws 排 成 长 度 为 上 的 TT 
小 的 丑 点 设置 。 提示 : 对 于 7? 二 N,N 一 1,…, 1, 计算 w wp cc, w 的 最 
好 的 排版 方式 。 
b. 给 出 你 的 算法 的 时 间 和 空间 复杂 度 ( 作 为 单词 个 数 N B eR BED | 
c. 考虑 我 们 使 用 行 式 打印 机 而 不 是 激光 打印 机 的 特殊 情况 , 假设 5 的 最 优 值 为 1 
(EREMO. 在 这 种 情况 下 , 不 允许 空白 收 舌 ,因为 下 一 个 最 小 的 宰 白 空间 走 0, 给 
出 一 个 线性 时 间 算 法 在 -一 台 行 式 打印 机 于 生成 最 小 的 丑 点 设置 。 
最 长 递增 子 序列 (longest increasing subsequence) 问 题 如 下 : 给 定数 ai ，a2，…，av， 
uis a, <a; € Xa, Hi irm 的 最 大 的 值 . 作为 -个 例子 ,如果 
输入 为 3, 1, 4,1, 5, 9, 2, 6, 5, 那么 最 大 递增 子 列 的 长 度 为 ACUTE PUN L, 4, 
5, 9)。 给 出 一 个 O(CN2) 算 法 求解 最 大 递增 子 序列 问题 。 
最 长 公共 子 序列 (longest common subsequence) 问题 如 下 : 给 定 两 个 序列 A= a), 
43,77, ay TB m bi, bo, oo, on, HRY A MB —dA dta ide EK F3 C- c. 02, 
… c BEER. 例如 , E 
A=d, y, Nn, a, M, i, C 
和 
B=p,r, 0. gsr, a, m, m. 1, n, g 
则 最 长 公共 子 列 为 a, m. 其 长 度 为 2, 给 出 -个 算法 求解 最 长 公共 于 列 问题 . 你 的 
算法 应 该 以 DO 〇 CUMN) 时 间 运 行 . 
字 型 匹配 问题 {pattern matching problem) 如下: 纵 定 一 个 文本 品 S Pp a, 
jxib P dp S 中 的 首次 出 现 。 近似 字 型 匹配 (approximate pattern matching) FAP 
1. 一 个 字符 在 S 中 但 不 在 P P. 
2, 一 个 字符 在 了 中 但 不 在 S H. 
3. PAIS 可 以 在 一 个 位 转 上 不 同 。 
的 到 次 误 匹 配 。 例 如 , AREP “data structures txtborpk” 中 搜索 “texthook ft 
许 最 多 一 次 旋 匹 配 ， 在 我 们 找到 一 个 匹配 ( 揪 人 一 个 e, 将 一 个 改变 成 co, 删除 一 个 
pj, 给 出 一 个 O(MN) 算 法 求解 近似 串 匹 配 问题 , 其 中 M=|PI 以 及 N=i13|。 
背包 问题 (knapsack problem) ff] — AHE X li F : 给 定 整数 集合 A = a1, azs c de 
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* 10.58 


* 10.59 
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WP BAK. 存在 A -AER K 子 集 吗 ? 
a. 给 出 -一 个 算法 人 以 时 间 O( NK RAET 
b. 为 杆 么 它 不 证 明 P= NP? 
给 你 一 个 货币 系统 , CHERIE ch. co. tt. ew 分 以 递减 顺序 排列 。 
a. 给 出 一 个 算法 计算 找 K 分 零钱 所 需 最 小 的 硬币 数 ， 
b. 给 出 一 个 算法 计算 找 及 分 零钱 的 不 同 的 方法 数 ， 
考虑 将 8 个 皇后 放 到 一 张 (8 行 8 列 的 ) 模 盘 上 的 问题 。 两 后 被 说 成 是 互相 对 攻 的 如 
果 她 们 处 在 则 一行, 或 同一 询 , 或 同一 条 (不 必 是 主 ) 对 角 线 上 。 
a. 给 出 一 个 随机 化 算法 把 8 个 非 攻击 皇后 放 到 棋盘 上 。 
b. 给 出 一 个 回潮 算法 解决 同一 个 问题 . 
c. 实现 这 两 个 算法 并 比较 它们 网 运行 时 间 。 
在 国际 象 祺 中 , 在 RÍTC)EBEELFERSIEGESIISCR' SBA 1C «B 列 ( 其 
中 BRAM ACD Ab, BRERA 
IR-R'|-2R'C-Cl|-1 
BL 
IR-R'i-1Ri1C-CIz2 
马 的 一 次 环 游 是 马 在 棋盘 上 的 一 系列 跳 行 ， 它 俗 好 访问 所 有 的 方 格 一 次 最 后 驻 回 
到 开始 的 位 置 。 | 
a. 如 果 BEAR, 让 明 马 的 环 话 不 存在 。 
b. 给 出 一 个 回潮 算法 找 出 马 的 一 次 环 游 。 












Distance 
Shortest( 5, T, G > 
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Distance dr. Tmp; 


ift ST) 
return 0; 

dy = =; . 
for each Vertex V adjacent ta 5 
| 

Tmp = Shortest( V, T, G ji 

ifC a + Tmp < Dr 
+ Imp; 


T 二 ey 





return d; 


图 10-79 jmd) Ec P EAE 


考虑 图 10-79 中 的 递归 算法 , 该 算法 在 一 个 无 力图 中 寺 找 从 SAT 的 最 短 赋 权 路 
径 。 Í 

a. 这 个 算法 对 于 一 般 的 图 为 什么 行 不 通 ? 

b. 证 明 该 算法 对 无 图 图 能 够 终止 。 

c. 该 算法 的 最 坏 情形 运行 时 间 是 多 少 ? 
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第 11 章 RM oO H 


在 这 一 章 ,我 们 将 对 在 第 4 章 和 第 6 章 出 型 的 几 种 高 级 数据 结构 的 运行 时 间 进 行 分 析 , 特 
别 是 我 们 将 考虑 任意 顺序 的 M 次 操作 的 最 示 情形 运行 时 间 。 这 与 更 一 般 的 分 析 有 所 不 同 ， 
后 省 蜂 对 单 次 的 操作 给 出 最 坏 情 形 的 时 间 界 ， 

例 旭 ,我 们 已 经 看 到 AVL 树 以 每 次 操作 O(logN) 最 坏 情 形 时 间 支 持 标准 的 树 操作 . 
AVL WAFER LS OP LS APREA FEFE iE MAMA AY oe 
须 保存 和 正确 地 更 新 。 使 用 AVL PASE FF, SEE CE Pe RJ OC NOB TE AI BET 
要 O N aE, ORR ER OP PR US, REM O(N) 最 十 情形 运行 
IE BI AN FTE BSIRIRE, EERE EPA n] SE BA. E Coplay tree) SEHK 种 
PY Soe ,虽然 任意 操作 仍然 需要 GCN ATA) (EER RAL A T UTD ER BAS MAR 
们 可 以 证 时 ,任意 顺序 的 M REPEC SE) ESP DO(MiogN) 最 坯 情形 时 间 。 因 此 ,在 长 时 期 运 
行 中 这 种 数据 结构 的 行为 就 像 是 每 次 操作 花费 O(logN) 时 间 一 样 。 我 们 把 它 称 为 摊 还 时 间 
3- (amortized time bound) - 

fits A Eos por n) e RT E88. ER ALES] TEC CIE EUIS DRE. 由 于 这 个 问题 一 
Be Ri JF A HE , Ae ROR BE a — 36 9L RT E GERE FB IR] B A Fn] Hp 18] EAE PB RA Bk 
ERES CHER. 摊 还 界 比 等 值 的 平均 情形 界 要 强 。 例 如 ,二 . 叉 查 找 树 每 次 操作 的 平均 
时 间 为 OUlogN) ,但 是 对 于 连续 M 次 操作 仍然 可 能 花费 DO(MN) 时 间 。 

党 为 得 到 摊 还 界 需 要 我 们 查看 整个 操作 序列 而 不 是 仅仅 一 次 操作 ,所 以 我 们 希望 我 们 的 
分 析 更 具 技 巧 性 .我们 将 看 到 这 种 期 望 一 般 会 实现 、 

Au ER 

”分析 二 项 队列 操作 - 

© PRE. 
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11.1 一 个 无 关 的 智力 问题 


考虑 下 列 问题 ;将 两 个 小 猫 放 在 足球 场 的 对 面 ,相距 100 fo 它们 以 每 分 钟 10 码 的 速度 
相向 行走 。 同 时 ,这 两 个 小 猫 的 母亲 在 足球 场 的 一 端 , 它 可 以 凡 每 分 钟 100 人 码 的 速度 跑步 。 猫 
妈妈 从 一 个 小 猫 跑 到 另 一 只 小 猫 ,来 回 轮 流 跑 而 速度 不 减 ,一 直 跑 到 两 个 小 猫 ( 以 及 它们 的 猫 
妈妈 ) 存 中 场 相遇 - 问 猫 妈妈 跑 了 多 还 ? 

使 用 塞 力 计算 不 难 解决 这 个 问题 。 我 们 把 细节 留 给 读者 ,不 过 ,预计 这 个 计算 将 涉及 旬 计 
EXSILIO, 虽然 这 种 直接 计算 能 够 得 到 答案 ,但 是 实际 上 通过 引入 一 个 附加 变量 ， 
Bin. [a] ,可 以 得 到 简单 得 多 的 解法 。 

轩 为 项 个 小 猫 相距 100 码 远 而 且 以 每 分 钟 20 码 的 合 速 度 互 相 接 近 , 所 以 它们 花 5 分 钟 即 
可 到 过 中 场 。 由 于 猫 妈 妈 每 分 钟 跑 100 码 ,因此 她 跑 的 总 距离 是 500 R3. 

这 个 问题 阐述 了 一 个 思路 , 即 有 时 候 间接 求解 一 个 问题 要 比 直 接 求解 容易 。 我 们 将 这 个 


eS PSE BEAT OO PEE EI. FETS) A— OY HH: «C potentia ,有 了 它 , 我 们 
RE E UE HA RT ED W]e - 


11.2 二 项 队列 


我 们 将 要 考查 的 第 一 个 数据 结构 是 第 6 章 中 的 二 项 队列 ,现在 进行 简要 的 复习 。 我 们 知 
道 ,二 项 树 B 是 一 棵 单 节 点 本 , 旦 对 于 到 >0, 二 项 树 B, 通过 将 两 棵 二 项 楠 B ;合并 到 一 起 
ifte. “A B,* Ba 如 图 11-1 所 示 ， 


图 11-1 二 项 树 B, Bi B3, B3 M D, 


一 棵 一 项 树 的 节点 的 秩 (rank) 等 于 它 的 儿子 节 扩 的 有， Q8 © 
个 数 ,特别 地 ,Bi ARTAR ko IRADE HEY L DRC 
二 项 树 的 集合 ,在 这 个 集合 中 对 于 任意 的 & 最 多 可 以 存 (53) 
£—XR BE H,- P 11-2 BAR TA OH, 和 A 3 
Ho. i 四 Da 

最 重要 的 操作 是 Mergc( 合 并 )。 为 了 合并 两 个 二 项 (8) 
队列 ,需要 执行 类 似 于 二 进 制 整数 如 活 的 操作 ;在任 一 时 
刻 ,我 们 可 以 有 零 . 一 .二 或 可 能 三 棵 及 WH, ERT 
两 个 优先 队列 是 否 包含 一 栋 B, 树 以 及 是 否 有 一 棵 Bs BURT RA. REE SRR 
B, 树 , 那 么 它 作为 一 神 酝 被 放 到 合并 后 的 二 项 队列 中 ;如 果 有 两 棵 b, BE ,那么 它们 镍 台 并 成 
A B,1 树 并 且 被 并 入 到 结果 中 ;如 开 有 三 襟 Bi 树 ,那么 将 一 棵 作为 树 放 入 到 二 项 队列 中 而 
另 其 棵 则 合并 成 一 棵 且 并 入 到 结果 中 。 厂 ;| 和 Ho 合并 的 结果 如 图 11-3 所 未 。 


"MO a 


图 11-2 两 个 二 项 队列 H A H 





图 11.3 ”二 项 队列 Ha GIF Hi 和 H, 的 结果 


插 人 操作 通过 创建 一 个 单 节点 二 项 队列 并 执行 一 次 Merge SESE AR. IX Dl 工作 所 用 的 
时 间 为 M+1, 其 中 M 代表 不 在 该 二 项 队列 中 的 二 项 树 By 的 最 小 型 号 。 内 此 ,向 一 个 有 一 机 
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By 树 亿 没有 B, 树 的 二 项 队列 进行 的 插入 操作 需要 两 步 ， 删除 最 小 元 通过 把 最 小 元 除去 并 
将 康 二 项 队列 分 裂 成 两 个 二 项 队列 ,然后 再 将 它们 合并 来 完成 。 第 6 章 给 出 了 对 这 些 操作 的 
比较 详细 的 解释 。 

我 们 首先 考虑 一 个 非常 篇 单 的 问题 。 假设 我 们 想 要 建立 一 个 含有 N 个 元 素 的 二 项 队列 。 
我 们 知道 ,建立 一 个 含有 N 个 元 素 的 二 叉 堆 可 以 以 OCN) 叶 间 完 成 ,因此 我 们 希望 对 于 二 项 
队列 由 有 一 个 类 似 的 界 。 

声明 : 

N 个 元 素 的 二 项 队列 可 以 通过 UN. COE A TAR O N ) 建 成 。 

这 个 声明 如 果 成 立 ,那么 它 就 给 出 一 个 极其 简单 的 算法 。 由 于 每 次 插入 的 最 坏 情 形 时 间 
是 O{logN), 因 此 ,这 个 声明 是 否 成 立 并 不 是 显然 的 。 考 处 到 如 果 将 该 算法 应 用 到 二 叉 堆 , 则 
运行 时 间 将 是 O(NlogN): 

要 想 证 明 这 个 声明 ,我 们 可 以 直接 进行 计算 。 为 了 测 出 运行 时 间 ,我 们 将 每 次 插入 的 代价 
定义 为 一 个 时 间 单 位 加 上 每 一 步 链 接 的 一 个 附加 单位 。 将 所 有 捅 人 的 时 间 代 价 求 和 就 得 到 总 
的 运行 时 间 。 这 个 总 的 时 间 为 N 个 单位 加 上 总 的 链接 步 数 。 第 一 .第 三 ,第 五 以 及 所 有 编号 
为 奇数 的 步 不 需要 链接 ,因为 在 插 人 时 Bo 不 出 现 。 因 此 ,有 - - 半 的 插 人 不 需要 链接 ,四 分 之 
的 括 人 只 需要 一 次 链接 (第 二 ,第 六 .第 十 次 插 人 等 等 ) ADS ~ 的 插 人 需要 两 次 链接 , 等 
等 。 我 们 可 以 把 所 有 这 些 加 起 来 并 确定 用 N 作为 链接 步 数 的 界 , 从 而 证 明 该 声明 。 dud, Si 
我 们 试 疼 分 析 一 系列 不 仅仅 是 插入 的 操作 的 时 蛋 , 这 种 蛮 力 计算 将 无 助 于 其 后 的 进一步 分 析 ， 
因此 我 们 将 使 用 另外 一 种 方法 来 证 明 这 个 结 昱 ， 

善 虞 一 次 插入 的 结果 。 如 果 在 插入 时 不 出 现 Bu 树 , 那 么 使 用 与 上 面相 同 的 计数 方法 可 
若 这 次 搬入 的 总 代价 是 一 个 时 间 单位 。 现 在 , 捅 人 的 结果 有 了 一 棵 Bo 树 ,这 样 ,我 们 已 经 把 
一 柠 树 添加 到 二 项 树 的 森林 中 。 如 果 存 在 : - 棵 Bo 树 但 是 没有 BAA ERT oc 
的 时 间 。 新 的 森林 将 有 一 棵 B, 树 但 不 再 有 Bo 树 ,因此 在 森林 中 机 的 数目 并 没有 变化 。 化 费 
三 个 单元 时 间 的 .次 插 人 将 创建 一 标 B 树 但 消除 一 梨 Bo 和 Bi 树 , 这 导致 在 森 宁 中 将 减 少 
Ht, HSL, APRS MRE * 个 单元 时 间 的 一 次 插入 导致 在 森林 中 兆 增 加 
2- c 棵 树 , 这 是 因为 创建 了 一 棵 B. Fm BER FLEURS B; BIOS EcL. 因此 ,代价 昂贵 
的 插入 操作 删除 一 些 树 ,而 低廉 的 插 人 人 却 创 建 一 些 树 。 

SO 是 第 i 次 插 人 的 代价 。 令 T 为 第 i 次 插入 后 的 树 的 棵 数 。T。=0 为 树 的 初始 棵 
数 ， 此 时 我 们 得 到 不 变 式 

C +(T;- T, 272 (11.1) 
TE 

C,* (T,- T9972 

Ct Ti. - T72 


Cx + (Tx 247 Ty-2) =2 
Cy t+ (Tx 7 Ty-1)=2 
cie; EE KR T, 项 被 消去 ,最 后 38 F 


N 
2, C; 十 Ix = To = 2N 
r=1 


E] 





^. 
21 C, = ZN- (Tx ~ Te) 
I 
考虑 到 Ty =O ELA N UT ATA Re TN 确实 非 负 . 因 此 (Tv =- Ty SEI. TE 


SIC, S2N 


这 就 证 明了 我 们 的 声明 . 

在 BuildBinomialQueue 例 程 运 行 期 间 ,每 一 次 楠 人 入 有 一 个 最 坏 情 形 运行 时 间 O (ogNN) fH 
是 由 十 整个 例 程 最 多 用 到 2N 个 单位 的 时 间 , Pe xx edi A BT D SEI RE REIR [HIA BT PR 
个 单位 的 时 间 。 

这 个 例子 阐明 了 我 们 将 要 使 用 的 一 般 技 巧 。 数 据 结 构 在 任 一 时 刻 的 状态 由 一 个 称 为 位 势 
(potential) 的 函数 给 出 。 这 个 位 势 函数 相 由 程序 保存 ,而 是 一 个 计数 装置 ,该 装置 将 帮助 进行 
分 析 。 当 一 些 操作 花费 少 于 我 们 允许 它们 使 用 的 时 间 时 , 则 没有 用 到 的 时 间 就 以 一 个 蝎 禹 位 
势 的 形式 “存储 "起 来 。 在 我 们 的 例子 中 ,数据 结构 的 位 势 就 是 树 的 棵 数 。 在 上 加 的 分 析 中 , 当 
我 们 有 一 些 插 人 只 用 到 一 个 单位 而 不 是 规定 的 两 个 单位 的 时 候 , 风 这 个 额外 的 单位 通过 增加 
位 势 而 被 存 情 起 来 以 备 其 后 使 用 。 当 操作 出 现 超出 规定 的 时 间 时 , 则 超出 的 时 间 通 过 位 势 的 
减少 来 计算 。 可 以 把 位 势 看 作 是 一 个 储蓄 账户 。 如 时 一 次 操作 使 用 了 少 于 指定 的 时 间 ,那么 
这 个 差额 就 被 存 鱼 起 来 以 备 后 而 更 昂贵 的 操作 使 用 。 图 11-4 fi B BuildBinomialQueue 对 一 
系列 插入 操作 所 使 用 的 累积 的 运行 时 间 。 可 以 看 到 ,运行 时 间 从 不 起 过 2N ,市 旦 在 任 一 次 插 
人 后 二 项 队列 中 的 位 势 计量 看 存储 量 。 


2N 
92 Total Time 
69 


Total Potential 
Q 4 8 12 16 20 24 28 32 36 40 44 


图 11-4 连续 N IKEA 
一 日 位 势 函数 被 选 定 , 我 们 就 可 写 出 主要 的 方程 : 
Taaa + APotential = Tas isa (11.2) 
T, 是 一 次 操作 的 实际 时 间 RER REV — URE aR PE TS SE DR GEE STH TRI E fi 
如 在 二 叉 查找 树 中 ,执行 一 次 Find( X) MSc Bret ial 1 加 上 包 合 X ai RE. SUR ET] 
对 整个 序列 把 基本 方程 加 起 来 ,并 日 最 后 的 位 势 至 少 像 初 始 位 势 一 样 大 ,那么 摊 还 时 间 MEE 
操作 序列 执行 期 间 所 用 到 的 实际 时 间 的 -个 上 界 。 注 意 , 妆 Tm 在 从 一 个 操作 到 另 一 操作 


LLLA 2s 


变化 时 ,Taworwed 却 是 稳定 的 。 
选择 一 个 位 势 函数 以 确保 一 个 有 意义 的 界 是 一 项 艰难 的 工作 ,不 存在 一 种 实用 的 方法 . 
一 般 来 说 ,在 尝试 过 许多 位 势 函 数 以 后 才能 够 找到 一 个 合适 的 画 数 。 不 过 ,上面 的 讨论 提出 一 
些 法 则 ,这 些 法 则 告诉 我 们 好 的 位 势 丙 数 所 具有 的 一 些 性 质 。 位 势 吗 数 应 该 
。 总 假设 它 的 最 小 元 位 于 操作 序列 的 开始 处 。 选 择 位 势 函 数 的 一 种 常用 方法 是 保证 位 
势 函 数 初始 值 为 0, 而 且 总 是 非 负 的 : 我 们 将 要 遇 到 的 所 有 例子 都 使 用 这 种 方法 。 
。 消 去 实际 时 间 中 的 一 项 。 在 我 们 的 例子 中 , 如 果实 际 的 花费 是 ,那么 位 势 改变 为 
2- c。 当 把 这 些 加 起 来 就 得 到 摊 还 花费 是 2, 这 在 图 11-5 PRH. 
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图 11-5 ERFIR E Gd A ERA CHR IE RT hr SPELL 


现在 我 们 可 以 对 二 项 队列 操作 进行 完整 的 分 析 。 

定理 11.1 

[Insert , DeleteMin 以 及 Merge 对 于 一 项 队列 的 摊 还 运行 时 间 分 别 是 

OCD.O(ClogN) fH O(logN). 

WERA: 

位 势 函 数 是 树 的 棵 数 。 初 始 的 位 势 函 数 为 0, 且 位 势 总 是 非 负 的 .因此 摊 还 时 间 是 实际 时 
间 的 一 个 上 界 。 对 Insert 的 分 析 从 上 面 的 论证 可 以 得 到 。 对 于 Merge, 假设 两 棵 树 分 别 
有 N NS 个 节点 以 及 对 应 的 Ti 和 T: 棵 树 。 令 N= NI + Noo 执行 合并 的 实际 时 间 
为 Otlog( Ni) + log(N3)) = O(ogN)。 在 合并 之 后 ,最 多 可 能 存在 iogN RBI, Ai es 
最 多 可 以 增加 O(logN)。 这 就 给 出 一 个 挫 还 的 界 OClogN). DeleteMin 的 界 可 用 类 似 的 
方法 得 到 。 


11.3 Sy 


二 项 队列 的 分 析 可 以 算是 一 个 容易 的 排 还 分 析 实例 。 现 在 我 们 来 考察 斜 堆 。 像 许多 的 例子 
_ 样 ,一 旦 找到 正确 的 位 势 函 数 ,分 析 起 来 就 容易 了 了。 困难 的 问题 是 选择 一 个 合适 的 位 势 函 数 。 

对 于 斜 堆 , 我 们 知道 关键 的 操作 是 合并 ”为 了 合并 两 个 斜 堆 , 我 们 把 它们 的 右 路 径 合并 并 
使 之 成 为 新 的 左 路 径 。 对 于 新 路 径 上 的 每 一 个 节点 ,除去 最 后 一 个 外 ， 老 的 左 子 树 作为 右 子 树 
而 附 于 其 上 。 在 新 的 左 路 径 上 的 最 后 节点 已 知 没有 右 子 树 ,因此 给 它 一 棵 右 子 树 就 不 明知 了 - 
我 们 所 要 考虑 的 界 不 依赖 于 这 个 例外 ,如 果 例 程 是 递归 地 编写 的 ,那么 这 又 旦 自然 要 发 后 的 入 
Bu. 图 11-6 显示 合并 两 个 斜 堆 后 的 结 采 - 





图 





图 11-6 合并 两 个 斜 堆 


设 我 们 有 两 个 斜 堆 H A 日 ; 并 在 各 自 的 右 路 径 上 分 别 有 ri 和 rs 个 节点 。 此 时 ,换行 合 
并 的 实际 时 间 与 ritr 成 正比 ,因此 我 们 将 省 去 大 O i TERE LB SET T TS ox EL 
个 单位 的 时 间 。 由 于 这 些 座 没有 固定 的 结构 模式 ,因此 丙 个 堆 的 所 有 节点 都 位 于 右 路 径 上 的 
情况 是 可 能 发 生 的 ,而 这 将 给 出 合并 两 个 堆 的 最 坏 情 形 的 界 OON) (A 11.3 BRAT 
例子 )。 我 们 将 证 明 人 台 并 两 个 斜 堆 的 排 还 时 间 为 OtlogN)。 

我 们 需要 的 是 能 够 获得 斜 堆 操 作 效 果 的 某 种 类 型 的 位 势 孔 数 。 我 们 知道 ,-- 次 合并 的 效 
果 是 人 外 在 右 路 径 上 的 每 一 个 节点 部 被 移 到 左 路 径 上 ,而 其 原 左 儿子 变 成 新 的 石 儿 了 于。--- 种 想 
法 是 把 每 一 个 节点 算 入 为 右 节 点 或 左 节 点 来 分 类 ,这 要 看 节点 是 右 儿子 还 是 不 是 石 儿子 米 定 ， 
这 时 我 们 把 右 节 点 的 个 数 作为 位 势 函 数 。 虽 然 位 势 初始 时 为 0 JE BL ESE 8 89 , fH Jc To UTE 
于 这 种 位 势 在 一 次 合并 后 并 不 减少 从 而 不 能 怡 当 地 反映 在 数据 结构 中 的 储备 景 。 这 样 的 结果 
使 该 位 热 限 数 不 能 够 用 来 证 明 所 要 求 的 界 。 

-个 类 似 的 想法 是 把 节点 分 成 重 节点 或 轻 节点 ,这 要 看 任 一 节点 的 右 子 树 上 的 节点 十 从 

比 左 子 树 上 的 节点 名 米 确定 . 

定义 ;一 个 节点 p 如 果 其 右 子 树 的 后 诊 数 至 少 是 该 的 后 诊 总 数 的 一 半 , 则 称 节 点 po 

重 的 ,否则 称 之 为 轻 的 。 注意 ,一 个 节点 的 后 裔 个 数 包 括 该 节点 本 身 。 

例如 .图 11-7 表示 一 个 斜 堆 。 关 键 字 为 15.3.6.12 和 7 的 节点 是 重 节点 , 面 所 有 其 他 的 
节点 都 是 轻 节 抬 。 





图 11-7 僚 堆 一 一 其 中 的 重 节 点 是 3.6.7.12 和 15 


我 们 将 竖 使 用 的 位 势 函 数 是 这 些 堆 ( 的 集合 ) 中 的 重 节 点 的 个 数 。 看 起 来 这 可 能 是 一 种 好 
的 选择 ,因为 一 条 长 的 右 路 径 将 包含 非常 多 的 重 节点 。 由 于 这 条 路 么 上 的 节点 将 要 交换 尼 们 
的 子 节点 ,因此 这 些 节 点 将 被 转变 成 合并 结果 中 的 轻 节 点 。 
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定理 11.2 
合并 两 个 斜 堆 的 摊 还 时 间 为 OlogN). 
WF BB : 


^ H 和 Hs; 为 两 个 堆 , 分 别 具 有 NI 和 NS PO. RH, BURIA 1, IER B 
RA, 个 重 节 点 ,共有 LA PUA. BH, dE HO RES EU i; 个 轻 节 点 和 AL 个 重 
节点 ,共有 Io thy 个 节点 。 

如 果 我 们 采用 约定 :合并 黄 个 儒 堆 的 花费 是 它们 右 路 径 士 节点 的 总 数 , 那 么 执行 合并 
的 实际 时 间 就 是 2) + 1+ hp + 上。 现在 ,其 重 / 轻 状态 能 够 疏导 的 节点 只 是 邦 些 最 初 位 
于 右 路 径 上 { 并 最 后 出 现在 左 路 径 上 ) 的 节点 ,因为 于 没有 别 的 节点 的 子 树 启 交换， 这 可 
ALT Ad 11-8 中 的 例子 。 





图 11-8 ”合并 后 重 / 痊 状 态 的 变化 


如 果 一 个 重 节 点 最 初 是 在 厂 路 径 上 ,那么 在 合并 后 它 必然 成 为 一 个 轻 节点 。 你 于 下 
路 径 上 的 其 余 那 些 节点 是 轻 节 点 ,它们 可 能 变 成 也 可 能 不 变 成 重 节 点 ,但 是 由 于 我 们 要 证 
明 : 一 个 上 界 ,因此 我 们 必须 假设 最 坏 的 情况 , 即 它们 都 变 成 了 重 节 点 并 使 得 位 势 增 加 .此 
时 , 重 节点 个 数 的 净 变 化 最 多 为 thh -ho WERE EA NA A Eie O E 
(11.2)) 加 起 来 则 得 到 一 个 摊 还 界 202) + lads 

现在 我 们 必须 证 明 i+ h= O0ogN). HF HUI 7S dE eU BEES ES Is B8 T X 
而 一 个 轻 节 点 的 右 子 树 小 于 以 该 轻 节 点 为 根 的 树 的 大 小 的 一 半 , 由 此 直接 推出 右 路 径 上 
轻 节 点 的 个 数 最 多 为 log Ny + log N, ix BRE O(logN) 

注意 到 初始 的 位 势 为 0 TB SE f RATE ETE HAS. 验证 这 C 
很 重要 ,因为 否则 捧 还 时 间 就 不 能 成 为 实际 时 间 的 界 调 朋 也 就 没有 意义 了 。 

由 于 Insert 和 DeleteMin 操作 基本 上 就 是 一 些 Merge, 它 们 的 摊 还 界 也 是 O(logN)。 


11.4 ERRE 


在 9.3.2 节 我 们 指出 如 何 使 用 优先 队列 改进 Dijkstra 最 短路 径 算 法 的 粗略 运行 时 间 
OCI vl), 重要 的 现象 是 运行 时 间 被 ; E | 次 DecreaseKey 操作 和 : V [2X Insert 和 DeleteMin 
操作 所 控制 。 这 些 操作 发 生 在 大 小 最 多 为 ,V| 的 集合 上 。 通 过 使 用 二 叉 推 ,所 有 这 些 操 作 花 
费 O(log| V DETE, Age Dijkstra 算法 最 后 的 界 可 以 诚 到 OX .E |log| VI 

为 了 降低 这 个 时 间 界 ,必须 改进 执行 DecreaseKey 操作 所 需要 的 时 间 : 我 们 在 6.5 节 所 
TERRA a- 堆 给 出 对 于 DecreaseKey 操作 以 及 Insert 的 Oog; V ATE ,但 对 DeleteMin 的 
FHE OC dlogy| Vl: 通过 选择 d 来 平衡 带 有 VIX DeleteMin 操作 的 | 二 | 次 DecreaseKey 
BE PE BY TE ER HH APES d 必须 总 是 至 少 为 2, 那 么 我 们 看 到 d 的 一 个 好 的 选择 是 
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d= maxr(Q,L EI ZA Va 
1718 Dijkstra 算法 的 时 间 界 改进 到 

OC E logos gi vip: VI) 

SPUR AB SHE REA 口 (1) 摊 还 时 间 支 持 所 有 基本 的 堆 操 作 的 一 种 数据 结构 ,但 DeleteMin RI 
Delete 除外 ,它们 花费 OflogN) 的 摊 还 时 间 。 我 们 立即 得 出 ,在 Dijkstra 算法 中 的 那些 堆 操 作 
将 总 共 需 要 O(E'-IVllogl V|) JIE]. 

45 S8 ME (Fibonacci heap) 人 通过 添加 两 个 新 的 观念 推广 了 二 叉 堆 ， 

DecreaseKey 的 一 种 不 同 的 实现 方法 ;我 们 以 前 看 到 的 那 种 方法 中 把 元 率 朝 同根 节 太 上 . 

滤 。 对 于 这 种 方法 似乎 没有 理由 期 望 O{1}) 的 挫 还 时 间 界 ,因此 需要 一 种 新 的 方法 。 

WR & + (lazy merging): 只 有 当 两 个 堆 需 要 合并 时 才 进 行 合并 。 这 类 似 于 懒惰 删除 。 对 

于 懒 情 合 并 , Merge 是 低廉 的 ,但 是 因为 懒 情 合 并 并 不 实际 把 树 结合 在 一 起 ,所 以 

DeleteMin 操作 可 能 会 遇 到 许多 的 树 , 从 而 使 这 种 操作 的 代价 高 晶 。 任何 一 次 DeleteMin 

都 可 能 花费 线性 时 间 , 但 是 总 能 够 把 时 间 归 答 到 前 面 的 一 些 Merge 操作 中 去 ， 特 列 地 ， 

一 次 昂贵 的 DeleteMin 必须 在 其 前 面 要 有 大 量 的 非常 低廉 的 Merge 操作 ,它们 能 够 储存 

额外 的 位 势 。 

11.4.1 切除 左 式 堆 中 的 节点 

在 二 叉 堆 中 ,DecreaseKey 操作 是 通过 降低 节点 的 值 然后 将 其 朝 着 很 上 涨 直到 建成 堆 序 来 
LMA ERRE F, CER D{logN) 时 间 , 这 是 平衡 树 中 通 向 根 的 最 长 路 径 的 长- 

如 果 代 表 优 先 队列 的 树 不 具有 O(logN) 的 深度 ,那么 这 种 方法 不 适用 。 例 如 , 癌 将 这 种 
FEAF ARH, J DecreaseKey 操作 可 能 花费 BCN) 时 间 , 如 图 11-9 中 的 例子 所 示 。 





111-9 通过 上 证 将 N 一 1 递减 到 0 花费 OCN ETT 


我 们 看 到 ,对 于 左 式 虚 来 说 DecreaseKey 操作 需要 另外 的 方法 。 我 位 的 例子 克 图 11-10 中 
的 左 式 堆 ， 假 设 我 们 想 要 将 值 为 9 的 关键 字 减 低 到 0。 若 对 该 堆 变动 , 则 必 将 引起 堆 序 的 本 
坏 ,这 种 破坏 在 图 11-11 中 用 虚线 标示 。 

我 们 不 想 把 0 上 滤 到 根 ,因为 正如 我 们 已 经 看 到 的 ， 存在 一 些 情况 使 得 这 样 做 代价 太 大 。 
铸 决 的 办 法 是 把 堆 沿 着 虚线 切 开 ,如 此 得 到 两 标 树 ,然后 再 把 这 两 棵 树 合并 成 一 檬 。 AXA 
Bi HUT DecreaseKey 操作 的 节点 , 令 P 为 它 的 父 节点 。 在 切断 以 后 我 们 得 到 两 棵 树 , 即 根 为 X 


a 





"这 个 名 字 来 白 于 这 种 数据 结构 的 一 个 性 质 , 丘 窗 我 们 车 FA Wurm. 
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的 HR D, T 是 原来 的 树 除去 H 后 得 到 的 树 ， 具 体 情况 如 图 11-12 Bro. 





图 11-12 切断 之 后 得 到 的 两 棵 树 


如 果 这 两 棵 树 都 是 左 式 堆 ,那么 它们 可 以 以 时 间 O(logN) 合 并 ,整个 操作 也 就 完成 了 。 
FEAH, H 是 左 式 堆 ,因为 没有 节点 的 后 裔 发 生变 化 。 由 于 它 的 所 有 节点 原本 就 满足 左 式 
堆 的 性 质 , 因 此 现在 仍 将 必然 满足 。 

然而 ,这 种 方案 似乎 还 是 行 不 通 ,因为 了 未 必 是 左 式 堆 。 不 过 ,容易 恢复 左 式 堆 的 性 质 ， 
这 要 用 到 下 列 两 个 观察 到 的 结论 : 

- HAM P BT, 的 根 的 路 径 上 的 节点 可 能 破坏 左 式 堆 的 性质 ;它们 可 以 通过 交换 子 闻 

点 来 调整 。 
。 由 于 最 大 右 路 径 长 最 多 有 | log(N + 1)J 个 节点 ,因此 我 们 只 需 检查 从 P 到 T. AR ADRS 
径 上 的 前 Llog(N+1)J 个 节点 。 图 11-13 显示 了 H, 和 将 T: 转变 成 天 式 堆 后 的 HS. 

因为 我 们 能 够 以 O (logN) 步 将 T 转变 成 左 式 堆 H, ， 然 后 合并 Hi 和 及;， 所 以 我 们 

得 到 一 个 在 左 式 截 中 执行 DecreaseKey H O UoN) 算法 。 图 11-14 显示 的 堆 是 该 例 的 最 后 
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R 11-13. 将 Ts 转变 成 左 式 堆 H 后 的 情形 


Ü 





图 11-14. 通过 合并 万 | 和 Hs 而 完成 操作 DecresseKey( H, X ,9) 


11.4.2 二 项 队列 的 懒 情 合并 

出 斐 波 那 契 堆 所 使 用 的 第 二 个 想法 是 同 惰 合并 {lazy merging)。 我 们 将 把 这 个 想法 用 于 
二 项 队列 并 证 明 执 行 一 次 Merge 操作 (还 有 插入 操作 , 它 是 一 种 特殊 情形 ) 的 挫 还 时 间 为 
Of 对 于 DeleteMin ,其 摊 还 时 间 仍 然 是 OQ (ogN)。 

这 个 想法 如 下 :为 了 合并 两 个 二 项 队列 ,只 要 把 两 个 二 项 树 的 表 连 在 -- 起 ,结果 得 到 - -个 
新 的 二 项 队列 。 这 个 新 的 二 项 队列 可 能 含有 相同 大 小 的 多 标 树 ,因此 破坏 二 项 队列 的 性 奈 。 
为 了 保持 一 致 性 ,我 们 将 把 它 叫做 懒 屏 二 项 队列 (lazy binomial queue) c 这 是 一 种 快速 操作 ,该 
操作 总 是 花费 常数 (最 坏 情 形 ) 时 间 。 和 前 面 一 样 ,一 次 插 和 人 通过 创建 一 个 单 节点 二 项 队列 并 
将 其 合并 而 完成 。 区 别 在 于 合并 是 懒惰 的 。 

Delete Min 操作 要 麻烦 得 多 ,因为 此 处 需要 我 们 最 终 把 懒 饶 二 项 队列 转变 加 到 标准 的 一 贰 
队列 , 不 过 , 正如 我 们 将 要 证 明 的 , 它 仍然 花费 O(logN ) 的 捧 还 时 间 而 不 像 以 前 是 
O(log N) 最 坏 情 形 时 间 。 为 了 执行 DeieteMin ,我 们 找 出 { 并 最 终 返 回 ) 最 小 元 素 。 如 前 所 述 ， 
我 们 将 它 从 队列 中 删除 ,使 得 它 的 每 一 个 子 节 点 都 成 为 一 棵 新 的 辆 。 此 时 我 们 通过 合并 两 标 
相等 大 小 的 树 直 至 不 再 可 能 合并 为 止 而 把 所 有 的 树 合并 成 一 个 二 项 队列 。 

例如 ,图 11-15 表示 一 个 懒惰 二 项 队列 。 在 一 个 懒惰 二 项 队列 中 ,可 能 有 多 于 ~ 棵 的 树 有 
相同 的 大 小 。 为 了 执行 DaleteMin ,我 们 同色 前 那样 把 最 小 的 元 素 删 除 ,并 得 到 加 11-16 中 

[436 ”的 树 。 


图 11.15 懒惰 二 项 队列 
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E 11-16 在 删除 最 小 元 素 13) 后 的 懒惰 二 项 队列 


现在 我 们 必须 将 所 有 的 树 合并 庙 得 到 一 个 标准 的 二 项 队列 。 一 个 标准 的 二 项 队 放 每 个 其 
上 最 多 有 一 棵 树 。 为 了 有 效 地 进行 这 项 工作 ,我 们 必须 能 够 以 正比 于 出 现在 (T) 中 树 的 棵 数 
的 时 间 ( 或 log ,哪个 大 用 哪个 ) 完 成 Merge。 为 此 ,我 们 构造 表 的 一 个 数组 : Los Lisos 
Lg o AP Rs 是 最 大 的 树 的 秩 。 每 个 表 Le BARAR 的 所 有 的 树 。 然 后 应 用 图 11-07 
中 的 过 程 。 


/*2*/ while |Lg! 2 2 do 
i 


/* 3*/ Remove two trees from ig; 
f* 4*/ Merge the two trees into a new tree; 
f* SR Add the new tree to Lei1: 


} 





图 11-17 恢复 二 项 队列 的 过程 


每 通过 一 次 过 程 中 从 第 3 行 到 第 5 行 的 循环 , 树 的 总 棵 数 都 要 减少 1。 这 意味 着 ,这 部 分 
每 次 执行 都 花费 常数 时 间 的 代码 只 能 够 执行 工 -1 次 ,其 中 人 是 树 的 棵 逆 。 这 里 的 for 循环 
计数 和 while 循环 未 尾 的 检测 花费 OtlogN) 时 间 , 这 使 得 运行 时 间 成 为 所 要 求 的 OCT + 
logN)。 图 11-18 显示 该 算法 对 前 面 二 项 队列 的 集合 的 执行 情况 。 
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图 11-18 ”把 一 些 二 项 树 合并 成 -个 一 项 队列 
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懒 情 二 项 队列 的 摊 还 分 析 
为 了 进行 懒惰 二 项 队列 的 捧 还 分 析 .我们 将 用 到 将 标准 二 项 队列 所 使 用 的 相同 的 位 势 函 
Oo ”有 因此, 懒 情 二 项 队列 的 位 势 是 树 的 棵 数 。 
定理 11.3 
Merge 和 Insert 的 摊 达 运行 时 间 对 于 悚 情 王 项 队列 均 为 {1)。DeletreMin 的 挫 还 运 

行 时 间 为 O(logN )。 

WERB: 

xx JR t fr pa os A FEA PRR. anf p rS 0. HAES EE OR 

的 。 因 此 ,经过 一 系列 的 操作 之 后 ,总 的 挫 还 时 间 是 总 的 运行 时 间 的 一 个 上 界 : 

对 于 Merge 操作 ,实际 时 间 为 常数 ,而 二 项 队列 的 集 人 台中 的 树 的 棵 数 足 不 变 的 ,内 

此 ,由 方程 (11.2) 可 知 挫 还 时 间 为 O(1)。 

对 于 Insert 操作 ,其 实际 时 间 是 常数 ,而 桂 的 简 数 最 多 增加 1, 因此 捧 玉 时 间 为 0(1)。 
操作 DeleteMin 比较 复杂 。 令 R 为 包含 最 小 元 素 的 树 的 秩 , 而 令 了 是 树 的 棵 数 ， 于 十 ， 
在 DeleteMin 操作 开始 时 的 位 势 为 了 。 为 执行 一 次 DeleteMin, 最 小 节点 的 各 于 节点 被 分 
离开 而 成 为 一 棍 一 梯 的 树 。 这 就 产生 了 TOR ORBI ,这 些 树 必 须要 合并 成 - .个 慰 准 的 二 
BAR). RK O 记 导 中 的 常数 ,那么 根据 上 面 的 论述 可 知 , 热 行 该 操作 的 实际 时 
间 为 T+ 民 +IogN.S 另 一 方面 , 巨人 敌 完 这 些 , 剩 下 的 最 多 可 能 还 有 log N PRT Alte fi 
势 函 数 最 多 可 能 增加 (logN) — T。 把 实际 时 间 和 位 势 的 变化 加 起 来 得 到 扒 还 时 间 界 为 
2logN+ 玉 。 由 于 所 有 的 树 都 是 二 项 树 , 因 此 我 们 知道 R<logN. A. RT 到 
DeleteMim B&fE ER BI [8] FRO Clog N ) ; 
11.4.3 SEIEHBSOHERRE 
下 如 我 们 前 面 提 到 的 SE iy Of S ME Jp GU HE DecreaseKey 操作 与 懒惰 二 项 队列 Merge je 
作 结合 起 来 。 不 过 ,我 们 不 能 一 点 修改 也 不 做 而 使 用 这 两 种 操作 -。 问题 在 于 ,如 果 在 这 些 二 项 
树 中 进行 任意 切割 ,那么 结果 得 到 的 森林 将 不 再 是 二 项 树 的 集合 。 因此 ,每 一 棵 树 的 秩 最 多 为 
i logN | 将 不 再 成 立 。 由 于 在 微 情 二 项 队列 中 DeiereMin 的 摊 还 时 间 p BEuEP E 2log N + R, A 
此 ,对 F DeleteMin 的 界 我 们 需要 R — O log N R: 

为 了 保证 尺 = O(ogN) ,我 们 对 所 有 的 非 根 节点 应 用 下 述 法 则 |: 

。 将 第 一 次 (因为 切除 而 ) 失 去 一 个 子 节点 的 ( 非 根 ) 节 点 做 上 标记 。 

， 如 果 被 标记 的 节点 又 失去 万 外 一 个 儿子 节点 ,那么 将 其 从 它 的 父 节点 切除 .这 个 节 后 
现在 恋 成 了 一 棵 分 离 的 树 的 根 并 且 不 再 被 标记 . 这 叫做 一 次 级 联 切 除 (eascading 
cut} ,因为 在 一 次 DecreaseKey 操作 中 ' 可 能 出 £i dc y X RITTER 

图 11-19 显示 在 DecreaseKey ETE BU ERAR RHE F BARB 当 关 键 字 为 a9 A E 

成 12 KIHE HERP RR . Rit BY cg ds PER SRR. GET 
& 33 a s cio EE 的 第 二 个 失去 的 子 节点 ,从 而 它 也 被 从 它 的 父 节 点 (1i0) 中 切除 - 
现在 ,10 也 失去 了 它 的 第 二 个 包子 ,于 是 它 又 从 5 PHR, 这 个 过 程 到 这 里 结束 ,因为 5 是 林 


PURE GBI EA WRT ETEK O ic c pe RR RAE RT ITH ST ET, ik fe CHE ABP ae 
Ta. 
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作 标 记 的 . 现在 把 节点 S 作 上 标记 、 结 昌 如 图 11-20 Bp. 


Ye 23) Q2) (74 (47) 

63) Q9 

(33) (39) 
(t) (46) 


图 11-19 4 39 EX, 12 SBE ISCHD EP ER 
GS — Q5 (9 (Q3 
(6) 


图 11-20 在 DecreaseKey $R IE 2c fei SEU AB SHE BY A Ex 


注意 ,过 去 被 作 过 标记 的 节点 10 和 33 不 再 被 标记 , 圭 为 现在 它们 都 是 根 节点 。 这 仁 时 间 
界 的 证 明 中 是 极其 重要 的 。 
11.4.4 时 间 界 的 证 了 明 
注音 ,标记 节点 的 原因 是 我 们 需要 给 任 一 节点 的 秩 R( 子 节点 的 个 数 ) 确 定 一 个 界 。 现 体 
我 们 证 明 具 有 N P REFECTI SRL ON O(logN), 
5138 11.1 
S 总 是 斐 波 那 契 堆 中 的 任 一 节点 S c 为 XX 的 第 i 个 最 年 轻 的 儿子 ， 则 c, BOT RIPE 
i-2. 
WRA: 
在 c 被 链接 到 X 上 的 时 候 ,X 已 经 有 (年 长 的 ) 儿 了 予 cl,cz,… .ce -1 于 是 , 当 链接 到 “ 
WX 至 少 有 ;二 个 儿子 。 由 于 节点 只 有 当 它们 有 相同 的 秩 的 时 候 才 链接 ,由 此 可 知 在 c, 
被 链接 到 X 上 的 时 候 c 至 少 也 有 ;一 1 个 儿子 ,从 这 个 时 候 起 , 它 已 经 至 多 失去 一 个 于 
节点 ,不 然 的 话 它 就 已 经 被 从 X 切除 。 因 此 ,c, 至 少 有 ;一 2 个 儿子 。 
从 引 理 11.1 容易 证 明 , 秩 为 R 的 任意 节点 必然 有 许多 的 后 商 。 
引 理 11.2 
^ FF 是 由 Fo=1,Fi=1; 以 及 Fe = Feo + 下 -2 定义 ( 记 1.2 TT ASSES I. RA 
REVERED ASDA Fei NAR AREAS). ; 
iE RA: 
A Sp 是 秩 为 R 最 小 的 树 。 显 然 ,So=1 和 $1=2. 根据 引 理 11.1 AR ER A A 
Reb R-2,R—-3,..-,1, 810 的 子 树 , 再 加 上 另 一 棵 至 少 有 -- 个 节点 的 子 树 。 连 辣 
Sr 的 根本 身 一 起 ,这 就 给 出 Ss = 2+ Sg S; BY Spo 的 一 个 最 小 值 。 和 容易 征明， 
Sp = Fg 1 (GRA 1.98). 
[3 ty x ELE AE ERR OE DS RE EUR s ^ JE ER ERU LL 
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513 11.3 
SER AN SHEET ARRA O(logN). 
证 朋 : 
直接 从 圭 曾 的 讨论 得 出 。 
假如 我 们 所 甘心 的 由 是 Merge, Insert 以 及 DeleieMin 等 操作 的 时 间 界 ,那么 我 们 现在 本 
ATUL qp 3E uERB TPE “OR SERED SCHEDE SME MFR ES -个 对 于 
DecreaseKcy 的 OC ATTY . 
对 于 一 次 DecreaseKey 操作 所 需要 的 实际 时 间 是 1.00 E EE BE EBA ed PT HUE; 8928 XX D ER 
的 次 数 。 由 于 级 联 切除 的 次 数 可 能 会 比 口 (1) 多 很 多 ,为 此 我 们 需要 用 位 势 的 损失 米 作 为 补 
f. MB 11-20 我 们 看 到 , 树 的 棵 数 实 际 上 是 随 着 每 次 级 悦 切 陈 而 增加 ,因此 我 们 必须 增 蝇 位 
势 函 数 , 使 它 包 含 莫 种 在 级 联 切 除 期 间 能 够 递减 的 成 分 。 注 意 ,我 们 不 能 从 位 擂 函 数 中 抛 开本 
的 棵 数 , 央 为 这 样 就 不 能 够 让 有 明 Merge 操作 的 时 间 界 了 .再 次 观察 图 11-20 RIAA ,级 联 切 
除 引 起 被 标记 的 节点 的 个 数 的 减少 ,因为 每 个 识 级 联 切 除 分 出 的 节点 部 灾 成 了 本 标 沁 的 很 。 
出 于 级 联 切 除 花费 1 个 单元 的 实际 时 间 并 将 树 的 位 势 增 加 1, 因此 我 们 将 每 个 标记 的 广 操 算 
作 2 个 位 势 单 位 。 利 用 这 种 方法 ,我们 就 获得 一 种 消除 级 联 切 除 次 数 的 机 会 : 
定理 11.4 
EE HE Sm MEG F insert. Merge 和 DecreaseKey [f BER AT A OY O (1). 而 对 于 
DeleteMin We OtlogN)- 
ur AA: 
38 BABS AR Se HE G6 ES PR RERI LR. AE T REL SRI fS 
为 和 并 且 总 是 非 鱼 的 ， 于 是 ,经 过 一 系列 操作 之 后 ,总 的 摊 还 时 间 则 号 总 的 实际 寺 间 的 - 
个 上 界 。 
对 于 Merge 操作 ,实际 时 间 为 常数 ,而 树 和 标记 节点 的 数目 是 不 蛮 的 ,因此 根据 方程 
(11.2) , 摊 还 时 间 为 O 〇 (1); 
对 于 Insert 操作 ,实际 时 间 是 常数 , 树 的 梨 数 增加 1, 而 标记 节点 的 个 数 不 变 。 因 此 ， 
立 势 最 多 增加 1 ,所 以 摊 还 时 间 也 是 Ot1). 
对 于 DelereMin 操作 . 令 R 为 包含 最 小 元 素 的 树 的 秩 , 并 令 了 是 操作 前 竺 的 棵 数 。 
六 执行 一 次 DeletcMin ,我 们 再 一 次 将 笠 的 儿子 分 离 , 得 到 另外 R 棵 新 的 树 。 注 意 ,虽然 
这 { 通 过 使 它们 成 为 未 标记 的 根 ) 可 以 除 天 一 些 标记 的 节点 ,但 却 不 能 创建 另外 的 标记 节 
下 这 民 棵 新 树 , 和 其 余 TO Mit TEMAS ,根据 引 理 11.3 其 化 费 为 了 了 +R+ 
logN 二 T+ O(logN)。 由 于 最 多 可 能 有 OtlogN) RA, 而 标记 节点 的 个 数 又 不 可 能 增 
加 ,因此 位 势 的 变化 最 多 是 O(logN) ~ T. 将 实际 时 间 和 位 势 的 变化 加 起 来 则 得 到 
DeleteMin 的 O Cog N EIJE 7r. . 
最 后 考虑 DecreaseKey PATE. 4 C 为 级 联 切 除 的 次 数 。DecreaseKey 的 实际 花费 为 
C+1, 它 是 所 执行 的 切除 的 总 数 。 第 一 次 ( 非 级 联 ) 切 除 创建 一 宛 新 树 从 而 使 位 势 增 1. 
每 次 级 联 切除 都 建 立 一 棵 新 树 ,但 却 把 一 个 标记 节点 转变 成 未 标记 的 ( 恨 ) 节点 ,合计 每 次 
BERA — PAIR REKE ETERA dic ET 11-20 中 
这 个 节点 为 5) 转变 成 标记 节点 ,这 就 使 得 位 势 增加 >。 因此 ,位 势 总 的 变化 最 多 是 3 一 CC。 
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把 实际 时 同和 位 势 变 化 加 起 来 则 得 到 总 和 为 4, 即 OC). 
11.5 伸展 树 


作为 最 后 一 个 合子 ,我们 来 分 析 伸 展 树 的 运行 时 间 。 出 第 4 章 得 知 ,在 对 某 项 X 进行 访 
问 之 后 ,- : 步 展 开通 过 下 述 三 种 一 系列 的 树 操作 将 X 移 至 根 处 : 单 旋转 (zig) ,之 字形 (zig-zag) 
旋转 和 一 字形 (zig-zig) 旋 转 。 树 的 这 些 旋转 如 图 11-21 所 示 。 我 们 约定 :如 果 在 节点 入 执行 
-次 树 的 旋转 ,那么 旋转 前 P 是 它 的 父 弛 点 ,G 是 它 的 祖父 节点 (车 X 不 是 根 的 儿子 的 话 )。 
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图 11-21 单 旋转 、 之 字形 和 一 字形 双 旋 转 操作 ,每 个 都 有 一个 对 称 的 情形 (未 示 出 》 


我 们 知道 ,对 节点 X 任意 的 树 操作 所 顷 的 时 间 正 比 于 从 根 到 X 的 路 径 上 的 节点 的 个 数 。 
如 果 我 们 把 每 个 单 旋转 操作 计 为 一 次 旋转 ,把 每 个 之 字形 操作 或 一 字形 操作 计 为 两 次 旋转 OG 
么 任何 访问 的 花费 等 于 1 加 上 旋转 的 次 数 。 

为 了 证 明 展 开 操 作 的 O(logN ) 捧 还 时 间 界 ,我 们 需要 一 个 位 势 函 数 ,该 函数 对 整 个 展开 
操作 最 多 能 够 增加 O(logN) 而 且 在 操作 期 间 也 消除 所 执行 的 旋转 的 次 数 。 找 出 满足 这 些 原 
则 的 位 势 函 数 根本 不 是 一 件 容 易 的 事情 。 首 先 容易 猜 到 的 位 势 两 数 或 许 就 是 树 上 所 有 节点 的 
深度 的 和 。 这 个 猜测 行 不 通 ,因为 位 势 在 一 次 访问 期 间 可 能 增加 6(N)。 当 一 些 元 素 以 连贯 
顺序 插入 时 会 有 这 样 的 典型 例子 发 生 。 

一 个 确实 有 效 的 位 势 函 数 胸 定 义 为 

P(T) = X logSCi) 


ET 
其 中 5S( 站 代表 i Bus BT CR i Bt). 这 个 位 势 函 数 是 对 树 本 所 有 节点 i 其 取 的 
SCO 的 对 数 和 。 
为 简化 记号 S EX: 

R(i)-logSCi) 
这 使 得 

®(T) = LR) 
Ri 代表 节点 i BUE 这 个 术语 类 似 于 我 们 在 不 相交 和 集 算法 分 析 .二 项 队列 和 斐 波 那 契 堆 中 


340 Bie 





人 一 — & ———— —- 一 一 一 一 —- 一 —- 一 一 一 ”一 . 一 一 一 
. —— —— I " i 
-- - - 


APRA AGE. FER XUI AE BEI E SCA PUR Ee ATS], AR RK 
小 的 对 数 的 阶 ( 幅 度 , magnitude), SE FRAN SY RHE, IB A ERE RE ROT) = 
logN. HARA RE ATA RRR P (OB P BE CRIME Do ARR, ERAF, 当 一 次 
旋转 可 以 改变 树 中 许多 节点 的 高 麻 时 , 却 只 有 已 和 G 的 秩 发 生变 化 、 
在 证 明 主 要 的 定理 之 前 ,我 们 需要 下 列 的 引 理 . 
引 理 11.4 
An at bic, tL a Me HAERA IA 
loga + logh=2loge 一 2 
TEAR : 
根据 算术 -几何 平均 不 等 式 ， 
V absz(a t b)/2 
于 是 
V abszc/2 
WAFA 
abc" /A 
Pi F ROT A E ERR UE 
我 们 现在 就 来 证 明 主要 定理 ,证 明 过 程 中 要 注意 所 用 到 的 一 些 预 备 知 识 ，。 
定理 11.5 
在 节点 X RIF TOT ORLA RTL RE BH 3CRCT) - R(X)) + 17 O(logN), 
VERA. 
WBA 了 中 节点 的 秩 的 各 。 
如 果 外 是 工 的 根 ,那么 不 存在 旋转 ,因此 位 势 没有 变化 。 访 问 该 节点 的 时 间 是 1; 于 
是 . 捧 还 时 间 为 1 ,定理 成 立 。 因 此 ,我 们 可 以 假设 至 少 有 一 次 旋转 
对 于 任意 一 步 展 开 操作 , 令 R,(X) 和 S,(X) 是 在 这 步 操作 前 X. 的 秩 和 大 小 ,并 令 
R,(X) 和 SCX) 是 在 这 步 展开 操作 后 X 的 秩 和 大 小 。 我 们 将 证 明 对 一 次 单 旋转 所 需 此 
的 摊 还 时 间 最 多 为 3(R(X) - R,(X)) +1, 而 对 一 次 之 字形 旋转 或 一 字形 旋转 的 摊 述 时 
问 最 多 为 3(RA(X) - R,(X))。 我 们 将 证 明 , 当 我 们 对 所 有 各 步 展 开 求 和 时 ,所 得 到 的 和 和 
就 是 想 要 的 了 时间 界 。 
一 步 单 旋转 :对 于 单 旋 转 sc ste a Ag Comi rS GU RX) +R P) ROX) - 
MP)。 注 意 ,位 盆 变化 容易 计算 ,因为 只 有 X. 的 和 P 的 树 大 小 有 变化 。 TÆ, 
AT ag = 14+ RjCX) + RP) - RX) - RAP) 
从 图 11-21 我 们 看 到 S,(P)SSAP), AE R (PZR (P). 2t, 
ATE + Ry(X) —RAX) 
由 于 S CX) 8,0), FE RIO - R(X) 220, RERET ED 00 H el 
AT, EI +3( R(X) ~ R(X)) 
_ 步 之 字形 旋转 :对 于 这 种 情况 ,实际 的 花费 是 2, 而 位 势 变 化 为 RiCX)+ RUP + 
RG)— RCX) - RCP) - RAG). PORES rg — Tr Bib TA 
AT ieg 727 R(X) + RCP) t R(G) - ROX) - RCP) - RCG) 
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从 图 11-21 我 们 看 到 ,Sy(X) = S,(G), 于 是 它们 的 秩 必然 相等 。 因 此 我 们 得 到 
AT gong =2t+ RAP)+ R(GG) - RCX) - RCP) 
我 们 还 看 到 SCP) 关 3S(X) 因而 R(X SR CP), RABE 
AV oea 2 + RO) + R(CG) -2RCX) 
从 图 11-21 我 们 看 到 Sr(P)+ S,CGOSES,CXO.. Sn TAL 11.4, 35 APR 145 51 
log S; CP) + logs CG)x2logS; CX) -2 
由 秩 的 定义 可 知 , 它 变 成 
R,CP) * RCG)&2R,CKX) - 2 
我 们 将 其 代入 则 得 
AT apeg ERARUX) - 2R,X) 
2 RX) - RCX)) 
由 于 R-CX)SR, CX). REETA 
AT agag 3 RAX) 7 R(X)) 

-- 步 一 字形 旋转 :第 三 种 情况 是 一 字形 旋转 。 这 种 情形 的 证 明 非 常 类 似 于 之 字形 的 
情形 。 重 要 的 不 等 式 是 RQOX) = RG) R X) R/ (CP), RSCX) SR CP), 以 及 
$,(X) + S(G)SSOX) 我 们 把 具体 细节 留 作 练习 11.8. 

整个 展开 的 摊 还 花费 是 各 生 展 开 的 梭 还 花费 的 和 . 图 11-22 hace 2 的 一 次 展开 
中 所 执行 的 各 步 展 开 的 过 程 。 令 R(2) RO) ,Rs(2) 和 Rs(2) 是 这 4 RRA 2 的 
佚 。 第 一 步 是 之 字形 旋转 ,其 花费 最 多 为 3(RQ0) - Ri(2))。 第 一 步 足 一 下 形 旋 转 , 其 花费 
W 3R (2) - R(2))。 最 后 一 步 是 单 旋转 ,花费 不 超过 3(R4(2) -Rs(2)+1o 因 此 总 的 花 
tte 3(Rs(2) 7 R02) + lo 





图 11-22 在 节点 2 展开 中 涉及 到 的 展开 各 步 


_. 般 地 ,通过 把 所 有 旋转 -一 其 中 最 多 有 一 个 旋转 可 能 是 一 次 单 旋转 一 一 的 捧 还 时 间 
加 起 来 ,我 们 看 到 ,在 节点 六 展开 的 总 的 时 间 最 多 为 3( Rj(X) ~ R(X))+1, 其 中 ROO 
X 在 第 ERATIK T ROO X 在 最 后 一 步 展开 后 的 秩 。 由 于 最 后 一 次 展开 把 X 
留 在 根 处 ,因此 我 们 得 到 3(RJT) - ROO) +1 HIBER TAH O(log ND. 
因为 对 一 棵 伸展 树 的 每 一 次 操作 都 需要 一 次 展开 ,因此 任意 操作 的 捧 还 时 间 是 在 一 次 展 
开 的 反 还 时 间 的 .个 常数 倍数 之 内 。 因 此 ,所 有 伸展 本 操作 花费 O(log MRENA, HEL 
使 用 更 一 般 的 位 势 函数 ,能 够 证 明 伸展 树 具有 若干 显著 的 性 质 。 更 多 的 细节 在 练习 中 讨论 。 
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我 们 在 这 一 章 看 到 捧 还 分 本 是 如 何 用 于 在 一 些 操 作 问 分 配 负 向 。 为 了 进行 分 析 , 我 们 构 
造 - -个 虚构 的 位 势 函数 ,这 个 位 势 晒 数 度量 系统 的 状态 。 高 位 势 的 数据 结构 是 易 变 的 , 它 建 立 
在 相对 低廉 的 操作 之 上 上 。 当 昂贵 的 花费 来 各 一 次 操作 的 时 候 , 它 会 由 前 面 一 些 操 作 节 消 下 的 
BE. 可 以 把 位 势 看 成 是 对 付 灾难 的 潜能 ,因为 非常 昂贵 的 操作 只 有 在 数据 结构 其 有 
一 个 高 位 势 以 及 已 经 使 用 的 时 间 比 规定 的 时 间 少 很 多 时 才 可 能 此生 。 

数据 结 梅 中 的 低位 势 意 昧 着 每 次 操作 的 花费 大 致 等 于 指定 给 它 的 消耗 量 。 贡 位 执意 味 着 
欠 俩 ;花费 的 时 间 多 于 规定 的 时 间 ,因此 分 配 ( 或 摊 还 ) 的 时 间 不 足 一 个 有 意义 的 界 。 

下 如 方程 {11.2) 所 表达 的 ,一 次 操作 的 摊 还 时 间 等 于 实际 时 间 和 位 势 变化 的 和 。 整 个 拉 
作 序 列 的 摊 还 时 间 等 于 总 的 序列 操作 时 间 加 上 位 势 的 净 变 比 。 只 要 这 个 请 变化 是 正 的 ,那么 
峻 还 界 就 提供 实际 有 时间 花费 的 一 个 上 界 并 且 是 有 意义 的 。 

选择 位 势 函 数 的 关键 在 于 保证 最 小 的 位 势 要 产生 在 算法 的 开始 ,并 使 得 位 势 对 低廉 的 操 
作 增加 而 对 高 昂 的 操作 减少 。 重 要 的 是 过 剩 或 节省 的 时 间 要 由 位 势 中 相反 的 变化 来 度量 。 不 
幸 的 是 ,有 了 时候 这 说 着 容 多 做 起 来 难 。 


练习 


1.1 什么 时 候 向 一 个 二 项 队列 进行 连续 M 次 捅 入 的 化 费 少 寸 2M 个 时 间 单 位 的 时 间 ? 
11.2 设 建立 一 个 有 N = 站 一 | 个 元 素 的 二 项 队列 , 交 蔡 进行 M 对 Insert 和 DeleteMin $$ 
作 。 显 然 ,每 次 操作 花费 OUlog N) 时 间 。 为 什么 这 与 捅 和 的 OC FERC ABA 
H? 
,11.3 通过 给 出 一 系列 导致 一 次 台 并 需要 G@(N) 时 间 的 操作 , ERR FERR a RE 
操作 的 O(log N) 捧 还 界 椒 能 转换 成 最 坏 情 形 界 。 
4 ”指出 如 何 进行 一 未 自 项 向 下 地 合并 两 个 斜 淮 并 将 合并 的 花费 减 到 O(1) 捧 还 时 间 ， 
5 扩展 斜 堆 以 支持 具有 O 〇 (log NOPEXSETIRISS DecreaseKey EE. 
11.6 SESUARESENE RHEE ESO Ej EAF Dijkstra 算法 时 的 性 能 。 
7 SEPARA BERE SEHR EREA APUL OR ILE UR FUOD. dü 
出 如 何 减少 指针 的 数量 而 运行 时 间 花 费 最 多 是 一 个 常数 央 十 。 
11.8 ”让 明 一 次 一 字形 展开 的 摊 还 时 间 多 为 3(RA(X) Ri( XX))。 
11.9 ”通过 改变 位 势 函数 能 够 证 明 展 开 的 不 同 的 界 。 令 权 靖 数 (weight function) 三 (为 指定 
给 树 中 等 个 节点 的 某 个 函数 , 令 S( 让 为 以 i 为 根 的 子 树 上 所 有 节点 (包括 节 太 i AE) 
的 权 的 种 。 对 于 与 用 在 展开 界 的 证 明 中 的 该 咕 数 相对 应 的 所 有 的 节点 ,特殊 情况 为 
Ww(i)-1,2- N 为 树 中 节点 的 个 数 ,并 令 M 为 访问 的 次 数 。 证 明 下 列 两 个 定理 : 
a. 总 的 访问 时 间 是 OCM + (M+ N)logN). 
«b. 如 果 g, 为 项 i 被 访问 的 次 数 , 而 对 所 有 的 i,q; >0, 那 么 总 的 访问 时 间 为 


» 
O(M + >} ¢,log(M/qi)} 


1 10 a 指出 如 何 实 现 对 伸展 树 的 Merge 操作 使 得 从 N 个 单元 素 树 开始 的 任意 六 -1 
次 Merge 操作 序列 花费 OCNIog? NN) 时间。 
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«b. 将 这 个 界 改 进 为 OCNIogiN ). 

11.11 我 们 在 第 5 PiE J MEY rehashing): 当 一 个 表 的 表 元 素 超 过 容量 一 半 的 时 候 , 则 
构造 一 个 了 荫 倍 天 的 新 表 , 且 整个 老 表 要 重新 被 散 刚 。 使 用 位 势 函 数 给 出 一 个 正式 的 
摊 还 分 析 来 证 明 一 次 播 人 操作 的 摊 还 时 间 为 OL) 

11.12 证 明 , 如 果 不 允许 删除 ,那么 到 一 株 六 节点 2-3 树 的 任意 顺序 的 M 次 插入 操作 产生 
OLM +N) 次 节点 分 裂 。 

11.13. 具有 堆 序 的 双 端 队列 (deque) 是 由 一 些 项 的 表 组 成 的 数据 结构 ,5 以 对 其 进行 下 列 操 
作 ， 
PushC X , D) 35238. X FRA BUD BA II D. 的 前 端 。 
Pop( D) : MG BA D 中 除去 前 端 项 并 将 它 返 四。 
inject X, D) :把 项 X HABIA AS] D BY EE 
Eject(D): Maha BAS] D 中 除去 尾 端 项 并 将 它 返 回 。 
FindMin( D ) :3& EI XX sgg BA 91] D 的 最 小 项 。 
a. di nef DARET ETE AS EA ER] PR ERE 

«b. 描述 如 何以 每 个 操作 常数 最 坏 情 形 时 间 支 持 这 些 操作 

11.14 证 明 二 项 队列 实际 上 以 O(HD) 摊 还 时 间 支 持 合并 操作 : 定义 二 项 队列 的 位 势 为 树 的 

ROI ERAN AE, 
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sB12:9 高 级 数据 结构 及 其 实现 


我 们 在 这 一 章 讨 论 七 种 重点 在 王 实 用 的 数据 结构 。 首 先 考查 第 4 章 计 论 过 的 AVL 树 的 
变种 ,包括 优化 的 伸展 树 , 红 黑 树 ,( 在 前 面 第 10 章 讨 论 过 的 }) 跳 茎 表 的 确定 性 的 拱 式 ,AA- 树 ， 
以 及 treap Bf. 

然后 我 们 考查 一 种 可 以 用 于 多 维 数据 的 数据 结构 : 在 这 种 情况 下 ,每 一 项 均 可 有 若干 关 
EF. kd 树 对 任何 关键 字 都 能 进行 相关 的 查找 . 

最 后 ,我 们 考查 配对 堆 {pairing heap) ,虽然 缺乏 分 析 结 果 AE EOF RSE RAR SE 
MEA. 

复议 的 论题 包括 : 

。 在 适当 的 时 候 非 递 归 的 自 顶 加 下 (而 不是 从 底 癌 上 ) 的 查找 符 的 各 种 实现 六 法 - 

« 详细 ,优化 的 尤其 是 利用 标记 节点 的 实现 方法 。 


12.1 自 顶 向 下 伸展 树 


在 第 4 章 ,我 们 过 论 了 基本 的 伸展 峙 操作 ， 当 一 项 X 作为 一 片 树叶 被 插入 时 , 称 为 展开 
(splay}) 的 一 系列 树 的 旋转 使 得 X 成 为 树 的 新 的 根 。 展 开 操 作 也 在 查找 期 间 执 行 , 而 旦 如 未 一 
项 也 没有 找到 ,那么 就 要 对 访问 路 径 上 的 最 后 的 节点 施行 一 次 展开 。 在 第 11 章 , 我 们 指出 - 
次 展开 树 操作 的 摊 还 时 间 为 O(logN)。 

这 种 展开 操作 的 直接 实现 需要 从 根 沿 树 往 下 的 一 次 遍历 ,以 及 而 后 的 从 底 癌 上 的 一 次 遇 
历 。 这 或 者 可 以 通过 保存 一 些 父 指针 来 完成 ,或 者 通过 将 访问 路 算 存 储 到 ~ -个 栈 中 来 元 成 。 
但 遗憾 的 是 ,这 两 种 方法 均 需 太 量 的 开销 ,而 且 二 者 都 必须 处 理 许 多 特殊 的 情况 。 在 这 一 站， 
我 们 指出 如 何在 初始 访问 路 答 上 施行 一 些 旋 转 。 结 果 得 到 在 实践 中 更 快 的 过 程 ,只 用 到 0O{1) 
的 额外 空间 ,但 却 保持 了 O Clog NO ERG TTA] AL. 

图 12-1 指出 单 旋 转 .一 字形 和 之 字形 情形 的 旋转 。( 照 惯例 , 逝 略 三 种 对 称 的 旋转 -在 访 
问 的 任 一 时 刻 ,我 们 都 有 一 个 当前 节点 X, 它 是 其 子 树 的 根 ;在 我 们 的 图 中 它 被 表示 成 “中间 ” 
i Oot 上 把 节点 都 存放 在 小 于 X 的 树 了 中 ,但 不 在 X KFR P AE, p R 把 节 点 存在 大 
F X Fete AEX 的 子 树 中 。 初 始 时 X 为 工 的 根 ,而 志和 民 是 空 树 。 

如 果 旋 转 是 一 次 单 旋转 ,那么 根 在 Y 的 树 变 成 中 间 树 的 新 根 。XX 和 子 树 B 连接 而 成 为 R 
中 最 小 项 的 左 儿 子 ;XX MAILE Eng NULIL。 2885, X RAR 的 新 的 最 小 项 . 特别 要 
注意 ,为 使 单 旋转 情形 适用 ,Y 不 一 定 必须 是 一 片 树叶 。 如 果 我 们 查找 小 于 了 的 一 项 ,而 了 
没有 左 儿 子 { 但 确 有 一 个 右 儿 子 ) ,那么 这 种 单 旋转 情形 将 是 适用 的 。 


轨 ” 为 简单 起 见 , 我 们 不 区 分 一 个 “节点 "和 访 节 点 中 的 项 ， p 
Oo EEEH MEUS BER NULL AMA ,因为 没有 必要 。 这 意味 着 ,PrintTreet K T A oam eee 88. T 
Af RF- 
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E121 自 顶 向 下 展开 旋转 : 单 旋转 .一 字形 旋转 及 之 字形 旋转 


对 于 一 字形 情形 .我们 有 类 似 的 剖析 : 关键 是 在 X 和 了 之 间 施 行 一 次 族 转 。 之 宁 形 情形 
的 旋转 把 底部 节点 Z 带 到 中 间 树 的 顶部 ,并 把 子 树 X 和 Y 分 别 附 接 到 R NL E. 注意 .了 
被 附 接 从 而 成 为 L 中 的 最 大 项 。 

之 字形 旋转 这 一 步 多 少 可 以 得 到 简化 ,因为 没有 旋转 要 执行 ,Z 不 再 是 中 间 树 的 根 ,Y 取 
而 代 之 ,如 图 12.2 所 示 。 因 为 之 字形 情形 的 动作 变 成 与 单 旋转 情形 相同 ,所 以 编程 得 到 简化 。 
看 起 来 这 是 有 利 的 ,因为 对 大 量 情形 的 测试 是 要 费时 的 。 其 缺点 是 ,仅仅 为 了 降低 一 层 ,我 们 
在 展开 过 程 中 却 要 进行 更 儿 的 选 代 。 


(3) D 
GR DEOR 
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图 二 -2 简化 的 自 顶 向 下 的 之 字形 族 转 
图 12-3 指出 一 旦 执行 完 最 后 一 步 展 开 我 们 将 如 何 处 理 L R 和 中 间 树 以 形成 一 棵 树 。 特 


别 要 注意 ,这 里 的 结果 不 同 主 从 底部 向 上 的 展开 。 关 键 的 问题 在 于 这 里 你 持 了 O(logN ) 的 摊 
X X CHO] 12.1)。 
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图 12-3 ” 自 顶 向 下 展开 的 最 后 整理 
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Se 


PEP BARE PO oe 12-4 所 示 。 我 们 想 要 访问 树 中 的 19。 第 一 步 是 一 个 


之 字形 旋转 .根据 图 12-2( 的 对 称 形式 ) ,我 们 把 根 在 25 的 子 树 带 到 中 间 树 的 根 处 ,并 把 12 5I 
它 的 左 子 树 接 到 工 E. 


Empty Empty 





"s Empty 
a 
9 Q3 
Q5 QU 
2) (20) 
(5) 15 G3 
(13) Qo 30) 
25) 
Q9 30) 


图 12-4 《访问 上 面 树 中 19) A ma FERRA 


下 一 步 是 一 个 一 字形 旋转 :15 被 提高 到 中 间 树 的 根 处 ,并 在 20 和 和 25 z BIET RE 
所 得 到 的 子 树 被 连接 到 R 上 。 此 时 查找 19 导致 终止 单 旋转 ， 中 局 树 的 新 根 为 18, 而 15 WE 
的 堪 子 树 作 为 工 的 最 大 节点 的 右 攻 子 被 接 上 。 根 据 终 12-3 重新 组 装 则 结束 该 步 展开 。 
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以 使 得 程序 避免 检测 空 树 。 第 一 次 堪 树 变 成 非 空 叶 ， 右 指针 将 被 初始 化 并 在 以 后 保持 不 变 。 
这 样 ， 人 在 自 顶 向 下 得 找 的 最 后 ， 它 将 包 合 右 树 的 根 。 类 似 地 , APRA ES ER. 

图 12-5 所 示 的 过 程 Initialize 用 来 分 配 NullNode 标记 。 我 们 合用 标记 NullNode 表示 - -个 
NULL 指针 。 我 们 将 反复 使 用 这 种 技术 来 简化 程序 (因而 使 得 程序 多 少 要 快 一 些 }。 图 12-6 
给 出 展开 过 程 的 程序 ,这 里 的 Header 节点 使 我 们 肯定 能 够 把 SIR 的 最 大 节点 上 而 不 必 
BÈR 可 能 是 空 的 {对 于 处 理 上 的 对 称 的 情形 类 位 地 进行 )。 


一 ”一 -一 


&ifndef  Splay H 


struct SplayNode; 
typedef struct SplayNode *SplayTree; 


SplayTree MakeEmpty( SplayTree T ); 

SplayTree Find( ElementType X, SplayTree T 3; 

SplayTree FindMin€ SplayTree T ); 

SplayTree FindMax( SplayTree T J; 

Splay]ree Initialize( void 5; 

SplayTree Insert EtementType X, SplayTree T ); 

SplayTree Remove( ETementType X, SplayTree T ); 
flementType Retrieve( SplayTree T 3; /* Gets root item */ 


endif /* Solay_H */ 


/* Place in the implementation file */ 
struct SplayNede 
{ 
ElementType Element, 
SplayTree Left; 
SplayTree Right; 
n 
typedef struct SplayNode "Position; 
static Position NullNode = NULL; /* Needs initialization */ 


SplayTree 
Initialize( void } 


ifi NullNode == NULL 2 
1 
Nu'lNode = malloc( sizeof( struct SplayNode ) 3; 
aft Nul!Node == NULL j 
FaralErrort "Out of space!!!" J; 
NullNode-»Left = NullNode-»Right = NullNode; 


return MullNode; 


图 12-5. ”伸展 树 :声明 和 初始 化 


正如 我 们 .上 面 提 到 的 ， 在 麻 开 末尾 重新 组 装 之 前 , Header. Left 和 Header. Right 分 别 指 着 
RR 和 上 (这 不 是 一 个 排 印 错误 一 一 苯 从 指针 的 指 问 )。 除了 这 个 细节 之 外 ,该 程序 是 祖 对 简 


"LIE 


/* Top-down splay procedure, */ 
/* not requiring Item to be in the tree */ 


SplayTree 
Splayt ElementType Item, Position X j 


static struct SplayNode Header; 
Position LeftTreeMax, RightTreeMin; 


Header.Left = Header.Right = NullNode; 
LeftTreeMax = RightTreeMin = &Header; 
NullhHode--Element = Item; 


while( Item l= X->Flement ) 
1 
ifi Item < X->Element } 
{ 
iff ftem < X->Left->Element } 
X = SingleRotatewithi eft( X 3; 
ifC X--Left == NullNode 3 
break; 
/* Link right */ 
RightTreeMin->Left = X; 
RightTreeMin = X; 
X = X-»left; 
] 


else 


if( Item > X-»Right--Element 2 
X = SingleRotateWithRight( X 5: 
if( X->Right == NullNode ) 
break; 
/* Link Left */ 
LeftTreeMax-»Right = X; 
LeftTreeMax = X; 
X = X->Right; 


} 
}  f* while Item !- X-»Element * y 


/* Reassemble */ 
LefrTreeMax-»Right = X-»Left, 
RightTreeMin->Left = X-»Right; 
X->Left = Header. Right; 
X--Right = Header.Left; 


return X; 





图 12.6 自 项 向 下 的 展开 计 程 


图 12-7 最 示 将 一 项 插入 到 树 T 中 的 过 程 。 一 个 新 的 指针 (如 果 需 要 ) 被 分 配 , 且 如 相 T 
是 空 的 ,那么 建立 一 棵 单 节点 树 。 否 则 ,我 们 围绕 ken RH T. 车 的 新 根 的 数据 等 于 
ltem, 则 我 们 有 一 个 复制 拷贝 ;我 们 不 是 再 次 搬入 Item, 而 是 为 将 来 的 插入 保留 NewNode 并 
立即 返回 。 如 果 T 的 新 根 包 含有 大 于 Bem 的 值 ,那么 T 的 新 根 和 它 的 右 子 树 变 成 New Node 
的 一 棵 右 子 树 ,而 T 的 左 子 树 则 成 为 NewNode 的 左 子 树 。 如 果 工 的 新 根 包 含有 小 于 Item HY 
值 , 那 么 类 似 的 逻辑 仍然 适用 。 在 这 两 种 情况 下 ,NewNode 均 成 为 新 的 根 。 


350 £123 





Splaylree 
Insert( ElementType Item, SplayTree T > 
{ 


static Position MewNode = NULL: 


iff MewNode zz NULL ? 
| 
NewNade = mallac( sizeof( struct SplayNode ) J: 
ift NewNode == NULL 3} 
FataltError(t "Out of space!!!" J; 
} 


NewNode->Element = Item; 


ifC T == NullNode } 
{ 
NewNode-»Left = NewNode->Right = NuilNede; 
T = NewNode; 
} 
else 
{ 
T = Splay¢ Item, T X; 
ift Item < T->Element ) 


i 
NewHode-»Left = T-»Left ; 
NewNode--Right = T; 
T-»ieft = NullNode; 
T = NewNode; 

} 

else 


if( T-»Element < Item ) 
t 
NewNode->Right = T->Right; 
NewNode->Left = T; 
T-»Right = NullMode; 
T - NewNode; 
j 
else 
return T; /* Already in the tree */ 
t 


NewNode = NULL; /* So next insert wil! cal! mallac */ 
return T; 





412-7 自 项 向 下 伸展 树 的 搬入 


在 第 4 章 , 我 们 证 明了 伸展 树 中 的 删除 是 容易 的 ,因为 一 次 展开 将 把 删除 上 且 标 放 在 根 处 。 
最 后 我 们 指出 图 12-8 中 的 删除 例 程 。 删 除 过 程 比 对 应 的 插入 过 程 还 要 短 OCA 


BREA BR GU GER. 351 


SplayTree 
Remove( ElementType Item, SplayTree T 3 
1 


Position New] ree 





iff T != NullNode ) 
| | 
T = 5play( Item, T ); 
if¢ Item == T--Element ) j 
| | 
/* Found it! */ 
if( T->Left == NullNode } 
NewTree = T->Right; 
else | 
i 
NewTree = T-»Left 
NewTree = Splay( Item, NewTree ); 
NewTree-»Right = T-»Right; 


i 
freagt T X; 
T = New Tree; 
H 
} 


return T: 


} 





图 12-8 ATT MMR 


12.2 2 Se 


历史 上 AVL BHAT AO — EPHEL H (red black tree)。 对 红 黑 树 的 操作 在 最 坏 情形 
下 花费 O(logN) 时 间 , 而 且 我 们 将 看 到 ,( 对 于 插入 操作 的 ) 一 种 慎重 的 非 递归 实现 可 以 相对 
容易 地 完成 (与 AVL 树 相 比 )。 

红 黑 树 是 具有 下 列 着 色 性 质 的 二 义 查 找 树 : 

|. 每 一 个 节点 或 者 着 成 红色 ,或 者 着 成 黑色 。 

2. 根 是 黑色 的 。 

3. 如 果 一 个 节点 是 红色 的 ,那么 它 的 子 节点 必须 是 黑色 的 。 

4. 从 一 个 节点 到 一 个 NULL 指针 的 每 一 条 路 从 必须 包含 相同 数目 的 黑色 节点 。 

着 色 法 则 的 一 个 推论 是 , 红 黑 树 的 高 度 最 多 是 2log( N + 1)。 因 此 ,查找 保证 是 一 种 对 数 
的 操作 。 图 12-9 显示 一 棵 红 黑 树 ,其 中 的 红色 节点 用 双 贺 圈 表 示 。 


(30) 





图 12-9 oy BL IS LA FE 10,85. 15,70. 20,60 30,50, 65, 80,90,40,5,55) 
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和 通常 -- 样 ,困难 在 于 将 一 个 新 项 插 人 到 树 中 : 通常 把 新 项 作为 树叶 放 到 树 !P。 un 
(HES RBG WARE EERE AAR SHREK NEV HORE. A 
I. ik PR RET RE A PRAT AA SR RES ea REST 
f& 19,352. 3x NS EEE E T, TER SAE. TEI PRT A al ETL 
ARE 3 满足 { 且 叉 不 引起 条 件 4 被 破坏 )， 用 于 完成 这 项 什 务 的 基本 操作 是 颜色 的 改变 各 
树 的 旋转 . 

12.2.1 Bie EBA 

我 们 已经 提 到 ,如 果 新 插 人 的 项 的 父 节 点 是 黑色 的 ,那么 插入 完成 。 因此 ,将 25 揪 和 人 到 图 
12-9 的 树 中 是 简单 的 操作 . 

如 果 父 节点 是 红色 的 ,那么 有 几 种 情形 (每 种 部 有 一 个 镜像 对 称 ) 需 要 考虑 。 首 先 , 假 设 这 
个 公 节 点 的 兄弟 是 黑 的 {我 们 采纳 约定 :NULL 节点 都 是 黑色 的 }，。 这 对 于 插入 3 8 是 通用 
的 ,但 对 搬入 99 不 适用 , 令 X 是 新 加 的 树叶 ,P 是 它 的 父 节点 ,S BART RRA 
在 ) ,是 祖父 节点 。 在 这 种 情形 只 有 四 和 PP 是 红 的 ,CG ERE, AA gi Ege de fi Ac mp8 PA 
个 相连 的 红色 节点 ,违反 六 红 黑 树 的 法 则 。 采 用 伸展 树 的 术语 , 关 ,P HG 可 以 形成 一 个 一 学 
形 链 或 之 字形 链 ( 两 个 方向 中 的 任 一 个 方向 }。 图 12-10 指出 当 PP 是 一 个 左 儿 子 时 (注意 有 一 
个 对 称 情形 ) ,我 们 如 何 旋 转 该 树 。 即 使 x 是 一 片 树叶 ,我 们 还 是 退出 更 一 般 的 情形 ,使 得 X 
在 树 的 中 间 。 后 面 我 们 将 用 到 这 个 更 一 般 的 旋转 。 





图 12-10 WE s 是 黑 的 , 则 单 旋 转 和 之 字形 旋转 有 效 


第 - .种 情形 对 应 P 和 G 之 闻 的 单 旋 转 ,而 第 二 种 情形 对 应 双 旋 转 , 该 双 旋 转 首先 厂 X 和 
P 问 进行 ,然后 在 祥和 之 问 进行 。 当 编写 程序 的 时 候 , 我 们 必须 记录 父 节 点 ECT AA LA 
及 为 了 重新 连接 还 要 记录 曾祖 节 上 总 - 

在 两 种 情形 下 , 子 树 的 新 根 均 被 涂 成 黑色 ,因此 ,即使 原来 的 曾祖 是 红 的 ,我 们 也 排除 T A 
个 相 部 红 节点 的 可 能 性 .同样 重要 的 是 ,这 些 旋转 的 结果 是 通 问 A.B HIC 诸 路 径 工 的 墨 节 
点 个 数 保持 不 变 。 

到 现在 为 止 一 切 顺利 。 介 是 ,正如 我 们 企图 将 79 插入 到 图 12-9 Wir 的 情况 一 样 ,如 果 5 
中 红色 的 ,那么 会 发 生 什 么 情况 昵 ? 在 这 种 情况 F ,初始 时 从 子 树 的 根 到 C 的 路 答 上 有 一 个 
黑色 节点 。 在 旋转 之 后 ,一 定 仍然 还 是 只 有 一 个 黑色 节 感 。 但 在 两 种 情况 下 ,在 通 向 C 的 路 
径 上 部 有 三 个 节点 (新 的 根 ,G OUS). 由 于 只 有 一 个 可 能 是 墨 的 ,又 由 于 我 们 不 能 有 连续 的 红 
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色 节 点 ,于 是 我 们 必须 把 S 和子 树 的 新 根部 涂 成 红色 , 面 把 GOD ERU S STRING 
这 很 好 ,是 是 ,如 果 曾 祖 也 是 红色 的 那么 又 会 怎样 呢 ? 此 时 ,我 们 可 以 将 这 个 过 程 厚 着 根 的 方 
fi) E38 ,就 像 对 也 树 和 二 叉 堆 所 做 的 那样 , 直到 我 们 不 再 有 两 个 相连 的 红色 节点 或 者 到 达 根 
( 它 将 被 重新 涂 成 墨色) 处 为 赴 。 

12.2.2 自 顶 向 下 红 黑 树 

上 滤 的 实现 将 划 用 --- 个 栈 或 用 一些 父 指针 保存 路 径 。 我 们 看 到 ,如 采 我 们 使 用 一 个 乌 顶 
向 下 的 过 积 , 实 际 上 是 对 红 黑 树 应 用 从 项 向 下 保证 S 不 会 是 红 的 过 程 , 则 仲 展 树 会 于 有 效 。 

这 个 过 程 在 概念 上 是 容易 的 . 在 向 下 的 过 程 中 当 我 们 看 到 一 个 节点 X 有 两 个 红 儿 于 的 
时 候 ,我 们 让 X 成 为 红 的 而 让 它 的 两 个 儿子 是 黑 的 。 图 12- 11 显示 这 种 鼎 色 翻转 的 现象 , 儿 
fi x B AP 也 是 红 的 时 想 这 种 翻转 将 破坏 红 黑 的 法 则 。 租 是 此 时 我 们 可 以 应 用 图 
12.10 中 适当 的 旋转 。 如 果 X 的 父 节点 的 兄弟 是 红 的 会 如 何 ? RP TREC RM ii ob ct 
程 中 的 行动 所 排除 ,因此 X 的 父 节 点 的 兄弟 不 可 能 是 红 的 ! Jy Bo, An AR ACTES F AIi E 
中 我 们 看 到 一 个 节点 了 有 两 个 红 儿 子 ,那么 我 们 知道 Y 的 孙子 必然 是 扰 的 ,由 于 Y 的 儿 于 
也 要 变 成 黑 的 ,其 至 在 可 能 发 生 的 旋转 之 后 ,内 此 我 们 将 不 会 看 到 上 基层 上 另外 的 红 节 后。 这 
KE FRITS X UE X 的 父 节 点 是 红 的 , 则 访 的 父 节点 的 兄弟 不 可 能 也 是 红 的 。 





E1211 颜色 翻转 :具有 当 X 的 父 节 点 是 红 的 时 候 我 们 才能 变 续 旋转 
例如 ,假设 我 们 要 将 45 插入 到 图 12-9 中 的 树 上 。 在 沿 树 向 下 的 过 程 中 ,我 们 看 到 50 有 
两 个 红包 子 。 因 此 ,我 们 执行 一 次 颜色 番 转 ,使 50 为 红 的 ,40 和 55 RAY. BOLE 50 和 60 HB 
是 红 的 。 我 们 在 60 和 70 之 间 执 行 单 旋转 ,使 得 60 是 30 的 右 子 树 的 黑 根 ,而 70 和 50 39 ET 
的 。 如 果 我 们 看 到 在 含有 了 黄 个 红 儿 子 的 路 径 上 有 另外 一 些 节 点 .那么 我 们 继续 ,执行 同样 的 操 
作 ， 当 我 们 到 达 树 叶 时 ,把 45 作为 红 节 点 揪 人 ,由 于 父 节点 是 黑 的 ,因此 插 人 完成 。 最 后 得 到 
Bg anb] 12-12 Aran. 






D 


(45) 


E1212 将 43 插 人 到 图 12-9 中 
如 图 12-12 所 示 ,所 得 到 的 红 黑 树 常 常平 衡 得 很 好 。 经 验 指 出 ,平均 红 黑 树 大 约 和 平均 
AVL 树 一 样 深 , 从 而 查找 时 间 一 般 接近 最 优 : 红 黑 树 的 优点 是 执行 插入 所 需 竖 的 开销 相对 较 
低 , 再 有 就 是 实践 中 发 生 的 旋转 相对 较 少 - 
红 时 树 的 具体 实现 是 复杂 的 ,这 不 仅 因为 有 大 量 可 能 的 旋转 ,而 且 还 因为 一 些 子 例 可 能 种 
空 的 {如 10 的 右 子 树 ) ,以 及 处 理 根 的 特 萄 的 情况 (尤其 是 根 没 有 父亲 )。 因此 ,我们 使 用 两 个 
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ETR: TEAR, — Pat NullNode, ELS TE FH RTE I E 8 PIHE Etam 07. NULL 48 
针 。 根 标记 将 存储 关键 字 — oA AA EAR HARTE. A, ARATE EAE Ta CAT 
整 。 递 归 的 例 程 都 很 巧妙 。 我 们 使 用 一 个 隐藏 的 递归 过 程 , 而 并 不 强迫 用 户 传递 T— Right. 
因此 用 户 不 必 关 心 法 区 点。 图 12-13 指出 好 何 重 新 编 与 中 序 逮 历 . 






/* Print the tree, watch out for NuüllNode, */ 
/* and skip header */ 

















static void 
DoPrint( RedBlackTree T 7 
í 
if T != NullNode ) 
1 
DoPrint( T-»Left ); 
Output( T-»Element ): 
DoPrint( T-»Right 3; 
} 


void 
PrintTreet RedBlackTree T ? 





DoPrint( T-»Right }; 
I 


图 12-13 (ERA PCM AP ae 


我 们 还 需要 使 用 户 调 用 例 程 Initialize 来 指定 涉 节 点 。 WRB RR, AS A Ini- 
tialize 应 该 再 为 NullNode 分 配 内 存 ( 其 后 的 树 可 以 分 享 NullNode). 这 和 类 型 声明 -起 如 图 
12-14 所 示 。 

接 下 来 ,图 12-15 显示 执行 一 次 单 旋 转 的 例 程 。 因 为 得 到 的 树 必 须 连 接 到 父 节点 上 ,所 以 
Rotate 抬 该 父 节 点 作为 一 个 参数 。 在 沿 着 树 下 行 的 时 候 ,我 们 把 Item 作为 参数 传递 ,而 不 是 
跟踪 旋转 的 类 型 。 由 于 我 们 希望 播 人 过程 中 旋转 很 少 ,因此 这 人 么 做 实际 上 不 仅 更 简单 ,而且 述 
ER, Rotate 直接 返回 执行 相应 单 旋转 的 结 采 。 

最 后 ,我 们 在 图 12-16 heh he ASHE. HAE HandleReorient M6 7b £138 S1 A A Per JL 
千 的 节点 时 被 调用 ,在 我 们 搬入 一 片 树叶 时 它 也 被 调用 。 惟 一 复杂 的 部 分 尾 ， -个 双方 转 实 味 
上 是 两 个 单 旋转 ,而 且 只 有 当 通 向 X 的 分 支取 相反 方向 时 才 进 行 。 正如 我 们 在 较 早 的 讨论 中 
担 到 的 , 当 沿 树 向 下 进行 的 时 候 , Insert 必须 记录 父亲 ,祖父 和 曾祖 。 注意 ,在 一 次 旋转 之 后 ， 
存储 在 福 父 和 曾祖 中 的 值 将 不 再 正确 、 不 过 ,可 以 肯定 到 下 一 次 再 需要 它们 的 时 候 它 们 将 被 
重新 人 在 储 。 

12.2.3 自 顶 向 下 删除 

红 黑 树 中 的 删除 也 可 以 自 顶 向 下 进行 。 每 一 件 工 作 都 归结 于 能 够 删除 一 片 树叶 。 这 站 内 
为 ,要 删除 一 个 带 有 两 个 儿子 的 节点 ,我们 用 石子 树 |- 的 最 小 节点 代替 它 ; 该 节点 必然 最 多 有 
一 个 儿子 ,然后 将 该 节点 删除 。 只 有 一 个 右上 儿子 的 节点 可 以 用 相同 的 方式 删除 , 面 只 有 一 个 左 
儿子 的 节点 通过 用 其 左 子 树 上 最 大 节点 替换 ,然后 可 将 该 节点 删除 。 注意 ,对 于 红 黑 树 ,我 们 
使 用 的 方法 绕 过 带 有 一 个 儿子 的 节点 的 情形 ,因为 这 吕 能 在 树 的 中 部 连接 两 个 红色 节点 ,为 红 
黑 条 件 的 实现 增加 困难 。 
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typedef enum ColorTvpe { Red, Black } ColarType; 


struct RedBlackNode 

1 
Elementlype Element 
RedBlackiree Left; 
RedBlackTree Right; 
ColorType Color; 

H 


Position NullNode = NULL; /* Needs inittalization */ 


/* Initialization procedure */ 
RedBlackTree 
Tnitializet void 3 
{ 
RedBlackTree T; 


if€ NullNode = NULL ) 
{ 
NullNoade == mallocé sizeoft struct RedBlackNode } 3; 
ifi Na 1Node == NULL } 
Fatalkrror( "Out of space!!!" J; 
NullMode--Left = NullNode--Right = NullNode; 
NullNode-»Color = Black; 
NullNade-»£lement = Infinity; 
t 


/* Create the header node */ 
T = malloc{ sizeaf( struct Red&lackNode ) 5; 
ifi T == NULL J 

FatalError( "Out of space!!!" 5; 
T->Element = NegInfinity; 
T-»Left = T-»Right = NullNode; 
T-»Color - Biack; 


return T; 





图 12-14 ”类 型 声明 和 初始 化 













一 一 一 
/* Perform a rotation at node X */ 

/* (whose parent is passed as a parameter) * f 
/* The child is deduced by examining Item * f 


static Position l 
Rotate( ElementType Item, Position Parent ) 


rr 


if( Item < Parent->Element ) 
return Parent->Left = Item < Parent-»Left-»Elemenr ? 

SingleRotateWithLeft( Parent->Left ) : 
SingleRotateWithRight( Parent-»Left ); 

15e 

eS return Parent->Right = Item < Parent-»Right-»Element 7 
SingleRotatewithLeft( Parent-»Right ) : 

SingleRotatewithRight( Parent-»Right ); 


图 12-15 旋转 过程 
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Static Position X, P, GP, GGP; 


static 
void HandleReorient( ElementType Item, RedBlackTree T > 
i 
X-»Color = Red; /* Do the color Flip */ 
X-»Left-»Color = Black; 
X->Right->Color = Black; 


ift P-»Color == Red ) /* Have to rotate */ 
{ 
GP-»Color = Red; 
if¢ {Item < GP->Element) t= (Item < P->Element) 3 
P = Rotate( Item, CP 3: /* Start double rotation */ 
X = Rotate( Item, GGF ); 
X-»Calor - Black; 


} 

T->Right->Color = Black; /* Make root black */ 
} 
RedBlackTree 


Insert( ElementType Item, RedBlackTree T > 
i 
X= P = GP = Ti 
NuliNode->Elament = Item; 
while( X-»Element l= Item ) /* Descend down the tree */ 


GGP = GP: GP = P; P= X; 

ifr Item < X-»ETement } 
X = X-»Left; 

else 
X = X-»Right; 

if( X-»Left-»Color == Red && X->Right->Color == Red j 
HandleReorient( Item, T J; 

} 


ifC X |= NullNode 3 
return NullNode; /* Duplicate */ 


X a malloct sizeof( struct RedBlackNode ) ); 

iff X == NULL ) 
FatalError( "Out of space!!!" ); 

X-»El1ement = Item; 

X->Left = X-»Right = MullNode; 

if( Item < P->Element } /* Attach to its parent x f 
P-rLeft = X; 

eise 
P->Right = X; 

HandleReorient( Item, T J); /* Color red; maybe rotate + 


return T; 


Ej 12.16 MAHE 


当然 ,红色 树叶 的 删除 很 简单 。 然而 ,如 果 一 片 树叶 是 黑 的 ,那么 删除 操作 会 复杂 得 多 LER 
为 黑色 节点 的 删除 将 破坏 条 件 4。 解 决 方法 是 保证 从 上 到 下 删除 期 间 笛 叶 是 红 的 。 

在 整个 讨论 中 , 令 X 为 当前 节点 ,了 是 它 的 兄弟 ,而 PREM. 开始 时 我 们 把 树 
的 根 涂 成 红色 。 当 党 树 向 下 遍历 时 ,我 们 设法 保证 X 是 红色 的 。 当 我 们 到 过 一 个 新 的 节点 
时 ,我 们 要 确信 P 是 红 的 (归纳 地 按照 我 们 试图 保 桂 的 这 种 不 变性 ) 并 且 X 和 了 是 黑 的 (因为 
我 们 不 能 有 两 个 相连 的 红色 节点 )。 存 在 两 种 主要 的 情形 。 
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首先 , 设 X 有 两 个 黑 儿 子 。 此 时 有 三 种 子 情况 ,它们 由 图 12-17 所 示 。 如 果 丁 也 有 两 个 
黑 儿 子 ,那么 我 们 可 以 翻转 X. T Ni P 的 颜色 来 保持 这 种 不 变性 。 否 则 ,了 的 儿 于 之 : -是 红 
的 。 根据 这 个 儿子 节点 是 哪 一 个 ,= 我 们 可 以 应 用 图 12-17 所 示 的 第 二 和 第 三 种 情形 表示 的 旋 
转 。 特 别 要 注意 ,这 种 情形 对 于 树叶 将 是 适用 的 ,因为 NullNode 被 认为 是 黑 的 。 

设 不 的 儿子 之 一 是 红 的 。 在 这 种 情形 下 RSI EEA XT AP. WOR 
幸运 ,X 滥 在 红 儿 子 上 , 则 我 们 可 以 继续 向 前 进行 。 如 果 不 是 这 样 ,那么 我 们 知道 THE 
的 ,而 X MP 将 是 黑 的 。 我 们 可 以 旋转 TAP, RS X 的 新 父亲 是 红 的 ;当然 X 和 它 的 祖父 
将 是 黑 的 。 此 时 我 们 可 以 回 到 第 一 种 主 情况 。 





图 12.17 当 久 是 一 个 左 儿 子 并 有 两 个 辕 儿 子 的 三 种 情形 


12.3 ”确定 性 跳跃 表 


我 们 看 到 的 用 于 红 黑 树 的 一 些 想 法 可 以 应 用 到 跳跃 表 以 保证 对 数 最 坏 情 形 操作 。 在 这 一 
节 .我 们 描述 产生 数据 结构 的 最 简单 的 实 更 方法 1-2-3 ACE UEBER E (deterministic skip list). 

回忆 第 10 音 讲 到 ,一 个 跳跃 表 中 的 节点 随机 指定 了 高 度 。 高 度 为 h 的 节点 包含 个 前 
向 指针 pp1, Prset Wip: 指向 高 度 为 i 或 更 大 的 下 一 个 节 忌 。 一 个 节点 具有 高 度 h A 
0.53( 为 了 实现 时 / 空 交换 ,0.5 可 以 用 0 和 1.0 之 间 的 任何 数 来 代 替 )。 因 此 ,我 们 期 望 只 处 
理 一 些 前 向 指针 直到 下 降 一 居 ; 由 于 有 大 约 logN Ja, 因此 我 们 得 到 每 次 操作 O ClogN ) 的 期 望 
运行 时 间 。 

为 使 这 个 界 成 为 最 坏 情 形 的 界 ,我们 需要 保证 只 有 常数 个 前 向 指针 需要 考查 直到 下 降 到 
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旋转 ， 
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更 做 的 一 层 。 为 此 ,我 们 添加 一 个 平衡 条 件 。 首 先 需 要 两 个 定义 ， 

定 史 :两 个 元 素 称 为 是 链接 的 flinked) ,如 条 至 省 存在 一 个 指 和 守 从 一 个 元 素 指 问 为 -个 元 
素 。 

定 光 :两 个 在 高 度 为 链接 的 元 素 间 的 间 际 容量 (gap size) S T EI IBS EA A-1 
JU IST 

1-2-3 BATE VE BEER Sei I oc E BO PE Fc : — CRE AS ZI n] SE ES E [8] Bt P) 89 A 
量 为 1.2 或 3。 例如 ,图 12-18 显示 一 个 上 2-3 MEHER. APITAR 3 HBT 
是 在 25 45 之 间 高 度 为 1 的 二 个 元 素 . 第 二 个 是 在 表 头 和 尾 之 问 商 度 为 2 的 三 个 元 素 。 尾 
TARS; CARARE T AAH EE X Xe? [8] BIO REUS: 88 9S 





图 12-18 -A 1-2-3 确定 性 跳跃 表 


显然 , 当 我 们 沿 任 一 层 行进 仅仅 通过 常数 个 指针 然后 就 可 下 降 到 低 一 层 . 因此 ,在 最 坏 的 
情形 下 查找 的 时 间 是 OtlogN )。 

为 了 执行 插入 ,我 们 必须 保证 当 一 个 高 度 为 的 新 节点 加 入 进来 时 不 会 产生 具有 四 个 高 
HJ A 的 节点 的 间 阶 。 实 际 上 这 很 简单 ,我 们 采用 类 似 于 在 红 黑 树 中 所 做 的 白 项 向 下 的 方法 
即 可 。 

设 我 们 在 第 工 层 上 ,并 正 要 降 到 下 一 层 去 。 如 果 我 们 要 降 到 的 间 承 容量 是 3, 堵 么 我 们 所 
高 该 间 辽 的 中 间 项 使 其 高 度 为 工 ,从 而 形成 丽 个 容量 为 1 的 间 院 。 由 于 这 使 得 朝向 删除 的 扎 
路 上 消除 了 容量 为 3 的 间隙, 因此 插入 是 安全 的 。 

例如 ,图 12-19 显示 项 27 到 图 12-18 的 确定 性 跳 蚂 表 中 的 插入 操作 。 在 关节 点 ,我 们 将 要 
从 第 3 层 降 到 第 2 层 。 由 于 下 降 将 落 入 到 容量 为 3 HHR, 因此 这 里 的 中 项 (25) 将 上 升 到 高 
度 3 并 在 表 中 被 拼接 好 。 在 第 2 层 的 误 找 将 我 们 带 到 25 ,我们 需要 在 此 外 下降 到 第 1 层 。 在 
这 里 又 见 到 容量 为 3 的 间隙 ,因此 把 35 提升 到 高 度 2。 结 果 如 畴 12-20 Bras, SRA 27 的 时 
候 ,将 它 接 到 表 中 ,如 图 12-21 Bran 





图 12.20 HA 27: 其 次 ,通过 提升 35 将 含 3 个 高 度 1 HT a BB] Bg ot 
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删除 的 困难 出 现在 间 了 容量 为 1 的 情况 。 当 我 们 看 到 将 要 下 降 到 一 个 容量 为 1 Ag 
时 ,我 们 把 这 个 闻 辽 放大 :或 者 是 通过 从 相 邻 间隙 (如 果 容 量 不 为 1) 借 来 的 方式 ,或 者 通过 降 
(RE ROSARY ARERR. APRA ES | 的 间隙, 因此 结果 变 
成 窑 量 为 3 的 间隙 。 由 于 有 凡 种 情形 要 处 理 , 因 此 程序 比 我 们 的 描述 稍微 复 民 一些- 

整个 过 程 是 如 何 实现 的 呢 ? 在 描述 了 所 有 的 细节 之 后 ,我 们 将 看 到 程序 代码 的 量 实际 上 
是 相当 小 的 。 

第 一 个 重要 的 细节 是 , 当 我 们 将 一 个 高 的 节点 提升 到 高 h + 1 的 时 候 , 我 们 不 能 花费 时 
i] Ofa) 用 于 将 疡 个 指针 拷贝 到 一 个 新 数组 。 否 则 , 插 人 的 时 间 界 就 要 成 为 O(log NO T.: 
_. 种 合理 的 方法 是 用 一 个 链表 表示 高 度 为 h 的 节点 中 的 个 前 问 指针 。 由 于 我 们 是 沿 着 各 
层 向 下 行进 ,因此 一 个 节点 的 链表 是 以 第 h 层 前 向 指针 开始 并 以 第 1 层 前 向 指针 结束 。 

第 二 是 优化 更 复杂 而 且 可 能 占用 一 些 空间 。 我 们 不 是 把 节点 作为 一 项 和 前 向 指针 的 链表 
来 存储, 而 是 存储 前 商 指针 和 前 向 项 对 的 链表 。 理解 其 含义 的 最 容易 的 方法 是 参考 图 12-22, 
它 是 图 12-21 的 另 一 种 表示 方法 。 我 们 将 使 用 术语 独 象 表示 或 远 辑 表示 来 描述 图 12-21 并 把 
图 12-22 当 作 是 (实际 的 ) 实 现 方 法 。 





首先 注意 ,除了 尾 节点 被 删除 外 ,抽象 表示 和 实际 实现 二 者 的 地 平 线 (skyline 一 即 我 们 
拓 左 到 右 扫描 的 高 度 ) 是 一 样 的 。 在 我 们 的 实现 中 ,每 “个 节点 都 留 有 使 我 们 下 降 一 层 的 指 
针 指向 同 层 上 的 下 -一 个 节点 的 指针 以 及 还 辑 上 存储 在 下 一 项 中 的 项 (如 原始 抽象 描述 所 壕 ) 

注意 .有些 项 的 出 现 是 多 于 一 次 的 ;例如 ,25 出 现在 三 个 地 方 。 事 实 上 ,如 果 一 个 方太 在 
抽象 表示 中 的 高 度 为 及 ,那么 它 的 项 在 实际 实现 中 就 会 出 现在 h 个 地 方 。 ARR SE 
和 惊人 的 结果 我 们 将 在 给 出 实现 方法 后 进行 解释 。 

千本 节点 由 一 个 关键 字 和 两 个 指针 组 成 。 为 了 使 编程 更 快 更 简单 ,我 们 使 用 了 一 个 尾 
点 :如 果 不 能 够 或 不 希望 赋值 ,那么 就 必须 用 到 别 的 技巧 。 我 们 对 头 节点 和 底层 节点 都 有 一 
个 标记 以 代 圭 NULL 指针 。 声 明和 初始 化 的 例 程 如 图 12-23 所 不， 

各 找 函数 与 随机 化 跳跃 长 的 相同 。 图 12-24 指出 ， 如 果 我 们 得 不 到 匹配 的 项 ,那么 或 者 问 
下 进行 ,或 者 向 右 进 行 ,这 依赖 于 比较 的 结果 。 如 图 12-25 所 示 , 插 人 操作 由 于 标记 的 引入 而 
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天 天 地 得 到 简化 。 利 用 某 些 烦 瑛 的 指针 跟踪 我 们 可 以 看 到 ,如 果 不 得 不 对 每 一 个 指针 是 否 是 
NULL 进行 测试 ,那么 我 们 就 会 很 容易 地 将 程序 代码 增加 三 倍 。 

图 12-25 指出 ,确定 性 跳 唉 表 插 入 过 程 的 程 摩 多 多 少 少 短 一 些 , 考 虑 的 情况 比 红 黑 树 少 得 
多 。 我 们 所 付出 的 代价 似乎 是 空间 :在 最 坏人 情况 下 我 们 有 2N 个 节点 ,每 个 半点 包含 两 个 指针 
和 一 项 。 对 于 红 黑 树 ,我 们 有 N 个 节点 ,每 个 节点 包 售 师 个 指针 .一 项 以 及 一 个 颜色 位 (bit)。 
因此 ,我 们 可 能 要 用 到 两 倍 多 的 空间 。 可 是 ,事情 没有 糟 到 这 一 步 。 首 先 , 经 验 指 出 ,多 定 性 跳 
版 表 平 均 使 用 大 约 1.57N PUA. Fk, ERAS Ae TEBEEK SE Bn fis FHBS S BID 
£7 

这 里 有 一 个 实际 的 例子 。 在 32 位 机 上 ,指针 和 整数 是 4 个 字 节 。 对 于 其 些 系 统 ,包括 某 
些 版 本 的 UNIX, 内 存 是 按 块 (chunk) 来 配置 的 ,它们 通常 是 2 的 宪 , 但 存储 管理 程序 使 用 4 个 
字 节 的 块 。 于 是 ,对 于 12 个 字 节 的 请 求 将 得 到 一 个 16 字 节 块 ;12 个 字 节 由 用 户 使 用 而 4 个 
字 节 作为 系统 开销 。 但 是 ,对 于 13 个 字 节 的 需求 则 必须 提供 一 个 32 SE DER. A aR 
帝 下 ,确定 性 跳跃 表 每 个 节点 使 用 16 个 字 节 ,而 平均 有 1.57N 个 节点 , 邦 总 数 一 般 约 为 25N 
个 字 节 。 可 是 , 红 黑 树 却 使 用 32N 个 字 节 1 这 说 明 在 某 些 机 器 上 一 个 附加 位 (bib 是 非 章 名贵 

470| “的 ;这 是 自 组 织 结构 的 吸引 力 之 一 。 


struct SkipNode 
f 


ElementType Element; 
Skiplist Right; 
SkipList Down: 


m 
static Position Bottom = NULL: /* Needs initialization */ 
Static Position Tail e NULL: /* Needs initialization * / 


/* Initialization procedure */ 


Skiprtist 
Initial!ze( void ) 
| 

SkipList L; 


ift Bottom == NULL } 
{ 


Bottom = malloc sizeof( struct SkipNode ) }; 
if( Bottom == NULL ) 

FatalError( "Out of space!!!" ); 
Bottom-»Right = Bottom-»Down = Bottom; 


Tail = malloc( sizeof( struct SkipHode 5 J; 
if(C Tail == NULL > 
FatalError( "Out of space!!!" 5; 
Tail-»Element = infinity; 
Tail-»Right = Tail; 
} 


/* Create the header node */ 
L = malloc( sizeof( struct SkipNode ) ); 
ifC L == NULL > 

FatalError( "Out of space!!!" 9; 
L--Element = infinity; 
L->Right = Tail; 
L->Down = Bottom, 


return L; 


873] 图 12.23， 确 定性 跳 腾 表 ;类 型 和 初始 化 ( 均 不 在 头 文件 中 ) 


————— 
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/* Return position of node contatning item, */ 
/* or Bottom if not found */ 


Position 
Find FlementType Trem, SkipList L 3 
i 


Bottom--Element = Item; 
while€ Item != Current->Element } 
ifi Item < Current->Element ? 
Current = Current--Down; 
eise 
Current = Current »Right; 


Position Current = |: 


return Current; 


Hi 1224 mETEBEB E: Find 例 程 
















SkinList 
Insert( ElementType Item, SkipList L 2 
{ 

Pasition Current = L; 

Position NewNode; 









Bottom->Element = Item; 
while( Current != Bottom ) 
i 

while( Item > Current->Element ) 
Current - Current--Right; 
























/* If gap size is 3 or at bottom level */ 

/* and must insert, then promote the middle element */ 

if( Current-»Element > 
Current-»Down-»Right-»Right--Element } 

1 


NewNode = malloc( sizeof( struct SkipNode ) ): 
if( NewNode == NULL j 
Fatal£rror( "Out of space!!!" J; 
NewNode-»Right = Current->Right; 
NewNode->Down = Current-»Down-»Right-»Right; 
Current-»Right = Mewhode: 
Newhodeg-»Elesent = Current-»Eiement; 
Current->Element = Current-»Down-»Right-»Element; 
} 
else 
Current = Current-»Down; 





/* Raise heighr of DSL if necessary * 
ift t-»Right != Tail > 
NewNode = malloc( sizeof( struct SkipNode Yj; 
ift NewNode == NULL > 

FatalErrort "Qut of space!!!" Ji 
NewNode->Down = Li; 
NewNode->Right = Tail; 
NewNode->Element = Infinity: 
L = NewNode; 


| 


return L; 


图 12-25 Wü EFEDEEKOE 18 A LEE 
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B XE TES RAIRE M-F HRR E. PT ATT OS CERE F p xc fr fa 
if(Current -> Element > Current -> Down —> Right — Right -> Element) 


(Rig m RH HE eer FF dk SP SA P ,那么 对 于 第 三 项 的 访问 可 以 直接 进 
行 ,而 不 用 再 通过 两 个 Right 指针。 图 12-26 表示 的 是 所 得 到 的 结构 ,这 个 结构 很 像 第 4 章 讨 
沦 前 马 树 。 我 们 称 之 为 1-2-3 WA E TEBE ERR AY k OF A a EO (horizontal array implementa- 
tion)。 正 如 存在 链表 形式 和 水 平 数组 形式 的 高 阶 RE, RINES a APRE A ES DER XE 
性 跳 路 表 。 哪 种 方法 最 好 还 有 得 研究 ,可 能 紧密 依赖 于 特定 的 系统 和 应 用 . 


ic 


Tal : IT 
E1226 158 1222 的 水 平 数组 实现 
12.4 AA- 树 


因为 大 量 可 能 的 旋转 , 红 里 树 的 编程 相当 复杂 ,特别 是 删除 操作 。 确 定性 点 获 表 的 编 往 里 
在 一 定 程度 上 要 少 一 些 ,但 仍然 是 相当 复杂 的 ,这 由 所 需 的 三 个 标记 可 以 看 出 。 当 然 ,确定 性 
踏 蚂 表 中 的 删除 是 一 项 非 平凡 的 工作 。 在 这 一 节 , 我 们 描述 二 叉 B- 树 (binary B-tree) 一 种 简单 
但 却 颇具 竞争 力 的 实现 方法 ,这 种 树 叫 做 BB- 树 。BB- 树 是 带 有 一 个 附加 条 件 的 红 黑 树 :一 个 
节点 最 多 可 以 有 一 个 红 儿 子 。 为 使 编程 容易 ,我 们 采纳 一 些 法 则 。 
1. 首先 ,我 们 加 入 只 有 右 刀 子 可 以 是 红 的 的 条 件 , 这 就 消除 了 约 一 半 的 可 能 重新 构建 的 
HE. 它 也 消除 在 删除 算法 中 一 个 恼人 的 情形 :如 果 一 个 内 部 节点 只 有 一 个 儿子 , 那 
么 这 个 儿子 一 定 是 右 儿子 ( 它 刚 好 是 红色 的 )， 国 为 黑色 左 儿 子 将 会 违反 红 黑 树 的 条 件 
4, Bi ,我 们 总 可 以 用 一 个 内 部 节点 的 右 子 树 中 的 最 小 节点 代替 该 内 部 节点 。 
2. 我 们 递归 地 编写 这 些 过 程 。 
3. 我 们 把 信息 存在 一 个 短 整 (short) 型 数 ( 例 如 8 个 比特 ) 中 ,而 不 是 把 一 个 颜色 位 (bit) 和 和 
每 个 节点 一 起 存储 。 这 个 信息 就 是 节点 的 层次 (level)。 节 点 的 层次 
JE 是 1, 若 该 节点 是 树叶 。 
« 是 它 的 父 节点 的 层次 , 若 该 节点 是 红 的 。 


S $b, Bae wae 
Current —» Element = = Current — Down — Right ~> Right -> Right -> Element 


对 其 些 系统 多 花费 200 mE! 


d LE dA AQ AJ GL 363 











* 比 它 的 父 节 点 的 层次 少 AAT RES, 

如 此 得 到 的 结果 是 一 棵 AA- 树 。 图 12-27 显示 用 于 AA- 树 的 甘 型 志明。 我 们 再 一 次 使 用 
标记 来 代表 NULL, 

旭 果 我 们 将 AA 结构 要 求 从 颜色 转换 成 层次 ,那么 我 们 看 到 ALE ORE BT AA 
好 低 一 个 层次 ,而 右 儿 子 可 能 比 父 节点 低 人 0 或 1 个 层次 (但 不 会 再 多 )， 

水 平 链 接 {horizontal link) 是 一 个 节点 与 同 层 次 上 的 儿子 之 间 的 连接 。 这 种 结构 需求 使 得 
水 平 链接 是 向 右 的 指针 ,并 且 不 能 有 了 两 个 连续 的 水 平 链接 。 图 12-28 显示 一 棵 AN- 树 的 示例 。 
查找 使 用 通常 的 算法 完成 。 一 个 新 项 的 播 人 总 是 在 底层 进行 。 不 过 .有 两 个 问题 产生 :2 BW 
人 将 产生 一 个 左 永 平 链接 ,而 45 的 禁 人 将 产生 两 个 连续 的 右 水 平 链接 。 


/* Returned für failures */ 
Position NuliNode = NULL; /* Needs more initialization */ 


struct AANOdg 


Element?ype Element; 
AATree Left; 


AATree Right; 
int Level; 
H 
AATree 


Initialize void ) 


| 
| 
| 
if( NullNode == NULL ) 
Mullhode = malloc sizeof( struct AANode 》 5); 
if( NullNode == NULL ) 

FatalErrori "Out of space!!!" 5: 
NullNode-»Left = NullNbde-»Right = NullNode; 
NullMode--Level = 0; | 


} 
return NuliNode; 





图 12-27 AA- 树 ; 某 些 类 型 声明 及 初始 化 


| 
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E] 12-28 插入 10.85,15,70.20,60,30.50,65,80,90,40,5,55,35 732) pu — BE AAR 


在 这 两 种 情况 下 一 次 单 旋转 都 可 以 使 问题 得 到 解决 :通过 右 旋 转 消 除 左 水 平 链接 ,通过 左 
旋转 消除 连续 的 右 水 平 链接 。 这 些 过 程 分 别 叫 做 Skew 和 Split, Al 12-20 是 这 些 原 语 的 代 
码 ， 一 次 Skew 除去 一 个 左 水 平 链接 ,但 可 能 会 创建 连续 的 右 水 平 链接 , 因此 我 们 首先 执行 
Skew ,然后 再 Solit。 在 一 次 Split 之 后 ,中 间 节 点 R 的 层次 增加 。 由 于 新 建 一 个 左 水 平 节 反 或 
连续 的 右 水 平 节 点 ,因而 引起 X 的 原来 父 节 点 的 一 些 问 题 ,这 两 个 问题 都 可 以 通过 上 滤 
Skew/Split 的 方法 解决 。 如 果 我 们 使 用 递归 算法 ,那么 这 可 以 自动 地 完成 、 图 12-30 描述 了 
这 两 个 过 程 。 

将 45 $8 ASN 12-28 中 的 AA- 树 的 动作 在 图 12-31 到 图 12-35 PRA. 此 时 的 所 入 过 程 
只 比 非 平衡 实现 多 商行 ,如 图 12-36 BAK 
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当然 ,删除 操作 是 更 复杂 的 ,不 过 ,由 于 我 们 除去 了 许多 的 特殊 情况 ,程序 代码 实际 上 是 相当 
合理 的 。 表 先 ,我 们 记得 ,如 果 一 个 节点 不 是 树叶 ,那么 它 必 然 有 一 个 石 几 了 手 , 这 意味 者 , 当 删 除 
一 个 节点 的 时 候 , 我 们 总 可 以 用 其 右 子 树 上 最 小 的 儿子 代 蔡 这 个 节 扣 ,这 保证 它 是 在 第 一 层 上 ， 





f* If T's left child is on the same level as T, */ 
/* perform a rotation */ 


AATree 
5kew( AATree T 3 
1 
ifi T->Left->Level == T->Level ) 
T = SingteRotatewithLeft¢ T 3; 
return T: 


} 


/* If T's rightmost grandchild is on the same level, 
/* rotate right child up */ 


AATraa 
Split( AATree T ) 
! 


if( T->Right->Right->Level == T->Level ) 
f 


T = SingleRetatewithRight( T 5; 
T->Leyel++; 


return T; 


图 12-29 AA-Bihi Skew 过 程 和 Split 过 程 


一 人 一 一 Q0 P 
(Right Rotation) AN AN Vian 





La, LEX 





B]1231 在 将 45 播 人 到 示例 树 中 以 后 





图 12.32 TE 35 Abt FT Split 之 后 
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图 12-35 在 Skew70 和 Spiic30 后 最 后 得 到 的 树 


Inserti ElementType Item, AATree T > 


ift T == NulTNode 3 
{ 
/* Create and return a one-node tree */ 
T = maliloc( sizeof struct AANode ) J; 
If( T -- NULL ) 
FatalError( "Out of space!!!" 3; 
else 


T-»Element = Item; T->Level = 1; 
T-»Left = T-»Right = NulTNodge; 


return T; 
i 
else 
ifC Item < T->Element ) 
T-»Left = Insert( Item, T->ieft 3; 
else 
if( Item > T->€lement ) 
T->Right = Insert( Item, T->Right 2; 


/* Otherwise it's a duplicate; do nothing */ 


T = Split( T 2; 
return T; 





图 12-36 AA- 树 ;搬入 过 程 


为 了 有 助 于 解决 问题 ,我 们 使 用 了 两 个 static 型 的 局 部 变量 DeletePtr 和 LastPtr。 因 为 
Remove 是 递归 过 程 ,所 以 这 两 个 变量 必须 是 static Mo 当 我 们 遍历 一 个 右 指 针 时 ,我 们 调整 
Teleteptr ,因为 我 们 递归 地 调用 Remove 直到 到 达 底 部 为 下 (在 沿 树 下 行 的 过 程 中 我 们 不 对 相 


等 进行 测试 ) ,这 保证 如 果 要 删除 的 项 在 树 了 上 ,那么 DeletePtr 将 指 问 包 含 它 的 节点 .LastPtr 
FRIAR eA, ACR TR AAA RS BL Pree RAD EL ABA LastPtr 
EZRA Wee Spee TS ex, AURA Z PR. 

BIA BE RARAGA CIE OR LIEU ATIS n BUA ET A LAARIN foe ES 
BR LAG 


ERAAI 点 的 层次 被 EE 
HAD A rodent 
s. 4 T RMA AL. WARIS T 
的 


个 儿子 的 层次 (实际 上 只 有 一 个 由 递 po WEM 4 ck CUR 
妥 油 用 所 输入 的 儿子 可 能 受 影 响 ,但 为 简 ee e BE RARE 
单 起 见 我 们 不 跟踪 它 ) 噬 低 到 比 THER 0 ERNE Stee BE LURLR 
完成 ,调用 两 次 Split 除去 连续 的 水 下 链接 

低 2 ,那么 工 的 晨 次 也 需要 降低 。 此 外 ,如 
果 十 有 -个 右 红 儿 子 ,那么 的 右 儿 子 也 必须 将 它 的 层次 降低 。 此 时 ,我 们 可 能 在 同一 层次 
上 有 6 个 节点 ;本 ,的 右 红 儿 子 尺 ,R 的 两 个 儿子 ,以 及 这 些 儿子 的 右 红 儿 子 。 图 12.37 表达 
了 最 简单 的 可 能 情况 。 

在 节点 1 删除 以 后 ,节点 2 从 而 节点 5 变 成 了 层次 为 1 的 节点 。 首 先 ,我 们 必须 调整 在 他 
点 5 和 3 之 间 引 人 的 左 水 平 链接 。 这 基本 上 需要 两 次 旋转 (一 次 是 在 节点 5 和 3 之 问 , 而 后 是 
在 节点 5 和 4 之 间 )。 在 这 种 情况 下 不 涉及 当前 节点 下 。 另 一 方面 ,如 果 骨 除 来 自 右边 ,那么 
了 的 左 节点 可 能 忽然 之 间 就 可 能 变 成 水 平 的 了 ;这 也 需要 一 次 类 似 的 双 旋 转 (在 了 开始 )。 为 
T BHO BUE BORED. ,我们 只 要 调用 三 次 Skew 即 可 。- 一 旦 调用 完成 , 则 再 调用 两 次 Split 
就 足以 重新 安排 这 些 水 平 的 边 。 整 个 删除 例 程 如 图 1238 所 示 。 从 各 方面 来 看 ,这 对 编程 来 
说 都 是 想 对 简单 的 数据 结构 。 


AATree 
Remove( ElementType Item, AATree T ) 
1 
static Position DeletePtr, LastPtr; 


ift T !'- Null!Node > 
i 


/* Step 1: Search down tree */ 


{* set LastPtr and DeletePtr */ 
LastPtr = T; 
if( Item < T->Element } 

T->Left = Remove( Item, T-»Left 3; 
else 


DeletePtr = 1; 
T-»Right = Remove( Item, T->Right ); 
} 





图 12-38 ”AA- 树 :删除 过 程 


co 这 个 按 巧 叮 以 用 于 Find 过 程 ,用 每 个 节点 的 两 路 比较 代 赫 在 每 个 节点 所 艇 的 三 路 比较 ,外 加 在 席 部 进行 的 儿 导 性 
Bi. 
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/* Step 2; If at the bottom of the tree and */ 
/* jtem is present, we remove it */ 
iff T == LastPtr } 

















ift DeletePtr !- NullNode ££ 
Item == DeletePtr-»Element ò 


DeletePtr->Element = T->Element; 
DeletePtr = NullNode; 
T = T-sRight; 


| 
| 
free( LastPtr 3; 


/* Step 3: Otherwise, we are not at the bottom; "/ 
* rebalance */ 


iff T->Left->Level < T->Level - 1 || 
T-»Right-»Level < T-»Level - 1 3 


ift T-»Right-»Level > --T-»Level ) 
T->Right->Level = T »Level; 

T = Skewl T 4; 
T-»Riüht = Skewt T-»Right 5; 
T-»Right--Right = Skew( T->Right->Right Ji 
T = 5plit( T jJ; 
T-»Right = Split( T-»Right 3; 

I 


return T; 


图 12-38(2€) AAA- 树 :删除 过 程 


12.5 treap fj 


最 后 一 种 二 叉 查 找 树 可 能 是 最 简单 的 一 种 ,叫做 reap 树 。 它 像 跳 跃 表 一 样 使 用 随机 数 并 
且 对 任意 的 输 人 都 能 给 出 O(logN ) 的 期 望 时 间 的 性 能 。 查找 时 间 等 同 于 非 平衡 二 叉 查 找 树 
(从 而 比 平衡 查找 树 要 慢 ) ,而 插 人 时 间 只 比 递 归 非 平衡 二 又 查找 树 的 实现 方法 稍 慢 。 旦 然 删 
除 操作 要 悍 得 多 ,但 仍然 是 O(logN ) 期 望 时 间 ，。 

teap 树 是 如 此 地 简单 ,以 致 我 们 不 用 画图 就 可 描述 它 . 树 中 的 每 个 节点 存储 -项 ,一 个 
无 利 右 指针 ,以 及 一 个 优先 级 ,该 优先 级 是 建立 节点 时 自动 指定 的 。 一 个 treap 树 就 是 一 柠 二 
VERA ,但 其 节点 优先 级 满足 堆 序 性 质 : 任 意 节 点 的 优先 级 必须 至 少 和 此 父亲 的 优先 级 一 
样 大 。 

其 每 项 都 有 不 同 优先 级 的 不 同 项 的 集合 只 能 由 一 个 treap 树 表 示 。 这 很 容易 由 归纳 法 
推导 ,因为 具有 最 低 优 先 级 的 节点 必然 是 根 。 H, HERRERA NI 种 可 能 的 排列 面 
不 是 根据 项 的 N! 种 排序 形成 的 。 类 型 声明 很 简单 ,只 要 求 Priority 域 的 加 法 。 标 记 NullN- 
ode 的 优先 级 为 co ,如 图 12-39 所 示 。 | 

£l] treap 树 的 插入 井 作 也 简单 :在 一 项 作为 树 时 如 人 之 后 .我 们 将 它 沙 着 该 treap Mia] ERE 
转 吉 到 它 的 优先 级 满足 堆 序 为 止 。 可 以 证 明 旋转 的 期 望 次 数 小 于 2。 在 要 被 删除 的 项 找到 以 
后 ,通过 把 它 的 优先 级 增加 到 oo 并 沿 着 低 优先 级 诸 儿 子 的 路 径 向 下 旋转 而 可 将 其 删除 。 一 旦 
它 是 树叶 ,就 可 以 把 它 除 去 。 图 12-40 和 图 12-41 中 的 环 程 利用 递归 实现 这 些 方法 .一 种 非 
递归 的 实现 方法 留 给 读者 去 练习 (练习 12.17). 对 干 删除 ,注意 当 节 点 逻辑 上 是 笃 叶 时 , 它 仍 


tb 


然 有 NullNode (EAE ALF AGILE. 因此 , 它 与 右 儿 子 旋转 ,在 旋转 后 , 工 为 NullNode, 
后 右 包 子 可 以 被 释放 ， 还 旧 注 意 我 们 的 实现 是 假设 设 有 重复 汇 ; 如 果 这 个 仍 卉 不 成 立 ,那么 
Remove HRE RIR, (Ata?) 


Treap 
Imtialize( void ) 
1 


1fC NullMade zz KULI. } 
! 


NullNode = mallac( sizeof€ struct TreapNade } J; 
ifC Sul Node == NULL 5 
FatalError( “Out of space!!!" J; 
NuliMode--Left = Nut lNode->Right = NullNede; 
NullWoede->Priority = Infinity; 
} 
return NuliNode; 





图 12.39 treap E PI S8 dE 


Treap 
Insert( ElementType Item, Treap T » 


if( T == NullNode 3 
{ 
/? Create and return a one-node tree */ 
T = mallac€ sizeaf( struct TreapNode ) 5; 
jf( T == NULL ) 
FatalError( "Out of space!!!" ); 
else 
1 
T-»Element = Item; T-»Priority = Random( }: 
T »Left - T->Right = Nul]Node; 
1 
else 
if( Item < T-»Element } 
i 
T-»Left = Inserti Item, T-»Left ); 
ift T-»Left-»Priority < T-»Priority } 
T = SingleRetateWithLeft( T 3; 
} 
else 
if( Item > T-»Element ) 


T->Right = Insert( Item, T->Right ); 
if( T-»Right-»Priority < T->Priority ) 
T = SingleRotateWithRight¢ T 5; 
t 


/* Otherwise it's a duplicate; do nothing */ 


return T; 





图 12-40 treaps: fh ATA 


ireap 树 特 别 容易 实现 是 因 为 我 们 绝对 不 必 担 心 调整 优先 级 域 。 平衡 树 处 理 方法 的 图 难 
之 一 是 追查 由 于 未 能 更 新 一 次 操作 过 程 中 的 信息 而 导致 的 销 误 。 从 那些 合理 的 插 人 和 删除 程 
序 包 中 的 所 有 程序 行 来 看 ,treap H, 特别 是 以 非 递 归 方法 的 实现 ,似乎 才 是 不 费力 的 瓦 家 。 
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Treap 

Remove( ElementType Item, Treap T ) 
ift T != NuliNnde } 
{ 


if{ Item < T->Element ? 

T-»-Left = Remove( Item, T--Left 5^; 
else 
ifi Item > T->Element 3 

T->Right = Remove( Item, T-»Right j; 
else 


/* Match found */ 

ifi T-»Left-»Priority < T->Right--Priorizy ) 
T = SingleRotatewithLeft¢ T 3; 

else 
T = SingleRotatewithRight( T 3; 


if€ T != NudlNode ) /* Continue on down */ 
T = Remove( Item, T 3; 
else 
1 
/* At a leaf */ 
freet T->Left 5; | 
T-»Left = NullNode; 
| | 
] 


t 
return T; 





图 12-41 treaps: 删 除 过 程 


12.6 k-d 树 


设 一 广告 公司 拥有 一 个 数据 库 并 需要 为 某 些 客户 生成 邮寄 标签 。 典型 的 要 求 可 能 是 需 雪 
散发 邮件 给 那些 年 龄 在 34 到 49 之 间 且 年 收入 在 100 000 卖 元 和 150 000 美元 之 间 的 人 们 j: 
这 个 问题 叫做 二 维 范围 查询 (two-dimensional range query )c 在 一 维 情况 下 ,该 问题 可 以 借助 
二 简单 的 递归 算法 通过 遍历 预先 构造 的 二 叉 查 找 烦 以 OCM + log N ) 平 均 时 间 解 决 。 这 里 ,M 
是 由 查询 所 报告 的 匹配 的 个 数 。 我 们 希望 对 二 维 或 更 高 维 的 情况 得 到 类 似 的 办 。 

一 维 查 找 树 具 有 简单 的 性 质 ; 在 奇数 层 上 的 分 支 按照 第 一 个 关键 字 进 行 , 而 在 偶数 层 上 的 
分 支 按 照 第 二 个 关键 字 进 行 。 根 是 任意 选取 的 奇数 层 ,图 12-42 XOR— BR 2-d 树 。 向 一 棵 2-a 
树 进 1 = 的 插入 操作 是 向 一 哥 二 叉 查 找 树 插 入 操 作 的 平凡 的 扩展 :在 沿 树 下 行 时 ,我 们 需要 保留 
当前 的 层 。 为 保持 程序 代码 简单 ,我 们 假设 基本 的 项 是 两 个 元 素 的 数组 。 此 时 我 们 需要 把 后 
限制 在 9 和 1 之 间 。 图 12-43 显示 的 是 执行 插 人 的 程序 。 在 这 一 节 我 们 使 用 说 归 ， 用 于 实践 
中 的 非 递归 实现 方法 是 简单 的 ,我 们 把 它 留 作 练 沪 12.25. 特别 是 由 于 若干 项 在 一 个 城中 可 
能 相同 ,因此 困难 之 一 是 重复 元 。 我 们 的 程序 允许 重复 元 , 且 总 是 把 它们 放 在 右 分 支 上 ,显然 ， 
如 果 有 太 多 的 重复 元 ,那么 这 可 能 就 是 一 个 问题 。 

稍 加 思索 便 可 确信 ,一 标 随 机 构造 的 2-4 树 与 一 覃 随机 二 叉 查 找 树 其 有 祖 同 的 结构 性 硕 : 
高 度 平均 为 O(logN) ,但 最 坏 情形 则 是 O(N)。 
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fl 12-42 2d 树 示 例 


static Kdfree 
Recursivelnsert( ItemType Item, KdTree T, int Level } 


ifC T == NULL ) 
{ 


T = malloc( sizeof( struct KdNede 3 J: 
af€ T == NULL > 
FatalError¢ "Out of space!!!" 3; 
T-»Left = T->Right = NULL; 
T-»Data( 0 ] = Item O ]; 
T->Dataf 1 1 = Item[ 1 !; 
} 


else 


if( Item{ Level ] < T-»Data[ tewel ] » 

T-»Left = Recursivelnsert( Item, T-»Left, !Level ); 
else 

T-»Righr = KRecursiveInsert( Item, Te>Right, !Level }; 
return T; 


j 

KdTree 

Insert ItemType Item, KdTree T j 
{ 


! 


return RerursiveInsert( Item, T, O 5; 





12-43. ”向 2-d 树 进 行 的 插入 


不 像 二 叉 查找 树 有 精巧 的 D(logN) 最 环 情形 的 变种 存在 ,没有 已 知 的 方案 能 够 保证 一 棵 
平衡 的 2-d 树 。 问 题 在 于 ,这 样 一 种 方案 很 可 能 基于 树 的 旋转 , 面 树 旋转 在 2-2 树 中 是 行 个 通 
By. 我 们 能 够 做 的 最 好 的 办 法 是 通过 重新 构造 子 树 来 定期 地 对 树 进 行 平衡 ,具体 撒 述 可 见 练 
习 。 类 似 好 ,也 不 存在 超越 明显 的 懒惰 删除 方法 的 删除 算法 。 如 果 在 器 要 处 理 查 询 之 前 所 有 
HA SN AGAR RE BL O( NlogN ) tf [a] #438 — AE AB EF @& 2-d 树 , 这 就 是 练习 
12.21c« 

有 几 种 查询 可 以 在 2-4d 树 上 进行 。 我 们 可 以 要 求 精确 的 匹配 ,或 者 基于 两 个 关键 宇 中 一 
个 关键 字 的 匹配 ;后 者 称 为 部 分 匹配 查询 (partial match query)» 这 两 种 都 是 ( 正 交 ) 范 围 查 词 
(range query) 的 特殊 情形 。 

正 交 范围 查询 给 出 其 第 一 个 关键 字 在 一 个 特殊 的 信和 集合 之 河 且 第 二 个 关键 字 在 另 一 个 特 
殊 的 值 集合 之 闻 的 所 有 的 项 。 这 下 是 我 们 在 本 节 介 绍 中 所 描述 的 问题 。 如 图 12-44 所 示 , 范 
围 查 询 通过 一 次 递归 的 树 遍历 容易 解 出 。 通过 在 递归 调用 之 前 进行 测试 ,我 们 可 以 避免 对 所 
有 节点 的 不 必要 的 访问 。 
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/* Print items satisfying */ 
/* Lowl 0 ] <= Item! 0 ] <= High! à ] and */ 
/* Low[ 1 j «=+ Item[ 1 ] <= High[ 1 ] */ 


static void 
RecPrintRange( ItemType Low, ItemType High, 
KdTree T, int Level } 
I 
iff T !- NULL 2 
i 
ift Low[ O T «= T->Batal 0 ] && 
T->Patal © ] <= High[ 0 ] & 
Low! 1 ] «<= T-»Data[ 1 ] && 
T->DatalL 1 ] «- High[ 1] } 
PrintItemi T->Data 7; 


RecPrintRange€ Low, High, Ten. !Leyel ): 
if( High[ Level ] >= T->Data[ Level ] 3 
RecPrintRange(C Low, High, T-»Right, !Levei }; 
} 
t 


void 


ifC Low[ Level } <= T--Datal Level | 
PrintRange( ItemType Low, ItemType High, KdTree T } 
| 


RecPrintRange( Low, High, T, Ù 9; 


! 





图 12-44 2-d 树 ; 范 围 省 找 


为 找到 特定 的 项 ,我 们 可 以 令 Low 3) High 等 于 我 们 要 查找 的 项 。 为 了 执行 一 次 部 分 蓄 
丁 ' 查 询 . 我 们 计 在 这 次 匹配 中 涉及 不 到 的 关键 字 的 范围 为 ~ co 到 o。 其 余 范 围 设 置 为 低 点 和 
高 点 等 于 号 配 中 所 涉及 的 关键 字 的 值 。 

在 2-d 侍 中 插 人 或 精确 匹配 查找 化 费 的 时 间 平 均 正 比 于 树 的 深度 , 即 O(logN), MÆR 
坏 情形 下 为 O(N)。 一 次 范围 查找 的 运行 时 间 依 赖 于 如 何 将 树 平衡 ,是 否 要 求 部 分 匹配 ,以 
及 实际 上 有 多 少 项 被 找到 。 我 们 提出 三 个 结果 ,它们 已 经 得 到 证 明 。 

对 于 理想 平衡 树 , 一 次 范围 查询 要 报告 M 次 匹配 可 能 花费 最 坏 情形 时 间 O(M+v N)。 
在 任 一 节点 ,我 们 可 能 必须 访问 4 个 孙子 中 的 两 个 ,于 是 成 立方 程 了 T(N)=2T(N/4)+ 
OU) ,然而 在 实践 中 ,这 些 查找 趋向 于 非常 有效 ,其 至 最 坯 情形 都 不 是 那么 差 , 因 为 对 于 典型 
的 N TESNA logN zd aga gk dT K O 记 叶 中 的 更 小 的 常数 所 补 途 。 

对 于 随机 构造 的 树 . 部 分 匹配 查询 的 平均 运行 时 间 为 O(M+ NRP asit 
./ 仆 7) /2( 见 下 面 )。 最 近 的 多 少 令 人 震惊 的 结果 是 它 基 本 上 描述 了 随机 2-4 树 的 一 次 范围 查 
找 的 平均 运行 时 间 。 

RFT b 维 的 情况 ,同样 的 算法 仍然 成 立 ,我 们 通过 每 层 上 的 那些 关键 字 进 行 乱 环 。 不 过 ， 
在 实践 中 平衡 升 始 变 得 越 来 越 差 ,因为 重复 元 和 非 随机 答 入 的 影响 一 一 般 变 得 更 为 明显 。 我 们 
把 编程 的 细节 留 给 读者 作为 练习 而 只 叙述 解析 结 后 : 对 于 理想 平衡 树 ,一 次 范围 查询 的 最 坏 情 
形 运 行 时 间 为 O(OM + ANLI4)。 在 随机 构造 的 &d 树 中 ,涉及 个 关键 字 中 的 p 个 关键 字 
的 部 分 匹配 查询 花费 OU(M+ NT) ,其 中 a 是 方程 

(+a) (Et a)? 52* 

(惟一 ) 的 正 根 。 对 各 种 p 和 ,a 的 计算 留 作 练习 ,类 =2 和 户 =1 的 值 反 映 在 上 面 对 于 随机 
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2-d P8 AY ASP OL AC AA BZA 
虽然 有 上 几 种 新 奇 的 结构 支持 范围 查找 ,但 是 kd PPR GAS] EE Bi a A] AY d fel 

单 的 结构 了 . 

12.7 配对 堆 


我 们 考查 的 最 后 一 个 数据 结构 是 配对 堆 (pairing heap)。 配 对 堆 的 分 析 问 题 仍然 木 解决 ， 
不 过 , 当 需 DecreaseKey 操作 的 时 候 , 尼 似 平 胜 过 其 他 的 堆 结 枸 。 它 的 高 效率 的 最 可 能 的 不 
因 是 它 的 简单 性 。 配 对 唯 被 表 示 成 堆 序 树 。 图 12-45 显 炙 一 个 配对 堆 示 例 。 











图 12-45 cfl E: fü iE 


配对 堆 的 具体 实现 用 到 第 4 章 中 所 讨论 的 左 儿 子 . 右 兄弟 表示 方法 。 我 们 将 看 刘 , De- 
creaseKey 操作 要 求 每 个 节点 包含 -个 额外 的 指针 。 作 为 最 左上 儿子 的 节点 含有 “个 指 同 其 父 
亲 的 指针 ;和 否则 这 个 节点 就 是 一 个 右 兄 弟 并 含有 一 个 指向 它 的 左 兄 弟 的 指针 。 我 们 将 把 这 个 
域 叫做 Prev 域 。 为 了 简洁 ,我 们 省 去 类 型 声 明 , 这 些 类 型 声明 是 完全 直观 的 。 图 12-46 指出 
图 12-45 中 的 配对 堆 的 实际 表示 。 





图 12-46 ”前面 的 配对 堆 的 实际 表示 


我 们 以 概述 基本 操作 开始 。 为 了 合并 两 个 配对 堆 , 我 们 使 具有 较 大 根 的 堆 成 为 具有 和 较 小 
根 的 堆 的 左 几 子 。 当 然 , 插 入 是 合并 的 特殊 情形 。 为 执行 一 次 DecreaseK ey ,我 们 降低 所 需要 
的 节点 的 值 。 因 为 对 于 所 有 的 节点 都 不 保存 父 指针 ,所 以 我 们 不 知道 这 是 否 会 破坏 堆 序 。 如 
此 ,我 们 将 调整 后 的 节点 从 它 的 父 节点 切除 ,通过 合并 所 得 到 的 两 个 堆 而 完成 DecreaseKey v 
作 。 为 了 执行 DeleteMin, 我 们 将 根除 去 ,得 到 堆 的 一 个 集合 。 WERA c 个 儿子 ,那么 对 合并 
过 程 进行 c -1 次 调用 将 该 堆 重建 。 这 里 ,最 重要 的 网 节 就 是 用 于 执行 合并 的 方法 以 及 如 何 应 
用 c -1 次 合并 。 

图 12-47 显示 和 如何 将 两 个 子 堆 合并 。 这 个 过 各 叮 被 推广 到 允许 第 二 个 子 堆 有 兄弟 的 情 
He 我 们 早先 提 到 过 ,可 以 让 具有 较 大 根 的 子 堆 成 为 男 一 个 子 堆 的 最 左 的 儿子 。 程序 很 简单 ， 
加 图 12-48 Aas. 注意 ,我 们 用 个 例子 ,在 这 些 例子 中 ,在 给 指针 贼 子 Prev i B SE ERES 
是 否 是 NULL。 这 使 我 们 想到 ,有 一 个 NullNode 标记 或 许 是 有 用 的 , 它 忆 惯 上 放 在 这 一 章 的 
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图 12-47 Compare&ndLink 合并 两 个 子 堆 


This is the basic operation to maintain order */ 

Links First and Second together to satisfy heap order */ 
Returns the resulting tree */ 

First is assumed NOT NULL */ 

First-»NextSibling MUST be NULL on entry */ 


Position 
CompareAndLink( Position First, Position Second ) 
{ 
if( Second == NULL ) 
return First; 
else 
ift First->Element <= Second->Etement 7 
i 
/* Attach Second as the leftmost child of First */ 
Second-»Pray = First; 
First-»MextSibling = Second->NextSibling; 
ift First-»MextSibling != NULL ) 
First-»Next5ibling-»Prev = First; 
Second->Nextsibling = First-»LeftChild; 
if( Second->NextSibling !- NULL 3 
Second-»NextSibling-»Prev = Second; 
First-»LeftChild = Second; 
return First; 
j 
else 
{ 
/* Attach First as the leftmost child of Second */ 
Second->Prav = First-»Praewv; 
First->Prev = Second; 
First-»NextSibling = Second->Leftchi ld; 
if( First->NextSibling != NULL ) 
First-»MextSibling--Prev = First; 
Second-»LeftChild 2 First; 
return Second; 





E1248 MIHE: Hmi TERRE 


Insert 和 DecreaseKey 操作 是 抽象 描述 的 简单 实现 。DecreaseKey 需要 一 个 Position 对 象 。 
由 于 一 项 的 Position 在 它 第 一 次 插入 时 被 确定 (不 可 改变 ) ,因此 Insert 通过 第 三 个 参数 Loc 把 
Position 3 EIS RUE , Loc 由 参考 值 传递 。 程 序 如 图 12-49 所 示 。 如 果 新 的 关键 字 值 不 小 于 
老 的 ,那么 DecreaseKey 的 例 程 显示 警告 信息 。 在 这 种 情况 下 ,最 后 得 到 的 结构 可 能 不 遵守 堆 
序 . 基本 的 DeleteMin 过 各 由 抽象 描述 直接 得 到 ,如 图 12-50 所 未: 
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/* Insert Item into pairing heap H */ 

/* Return resulting pairing heap */ 

/* A pointer to the newly allocated node */ 
/* is passed back by reference and accessed as *Loc */ 




















PairHeap 
Insert ElementType Item, PairHeap H, Position *Loc ) 
1 

Position NewNode; 


NewNode = mallac€ sizeof( struct Pairhode ) J; 
1f( MewNode == NULL } 

FatalError( "Out of space!!!" J; 
MewMode-»Element = Item; 
NewNode-»LeftChild = NewNode->NextSibling = NULL; 
NewNode->Prey = NULL; 


"Loc x HewNode; 
if( H == NULL ) 
return NewNode; 
alse 
return CompareAndLink( H, NewNode 5; 


/* Lower item in Position P by Delta */ 


PairHeap 
DecreaseKey( Position P, ElementType Delta, PairHeap M } 
i 
ift Delta « Ùj 
Errori “Decreasekey called with negative Delta" 3; 


P-»Elament -= Delta; 
if( P == H } 
return H; 


ife P->NextSibling !z NULL ) 
P-»NextSibling-»Prev = P->Prev; 

iff P->Prey-sLaftChild == P } 
P_>Prev->LeftChild = P-»NextSibling: 

else 
P->Prev--NextSibling = P->NextSibling; 


P->NextSibling = NULL; 
return CompareAndLink( H, P ); 


图 12-49 BRP HE: Insert 和 DecreaseKey 


PairHeap 
DeleteMin( ElementType *MinItem, PairHeap H ) 


4 


Position NewRoot = NULL: 


if TsEmpty€ H } 3 . 
Error( “Pairing heap is empty!" ); 


else 
{ 


*MinItem = H->Element; 
if( H-»LeftChild (= NULL ) | 
NewRoot = CombineSiblings( H->LeftChiid 
free( H 2; 
t 


return MewRoct; 





[E 12-50 We xT HE DeleteMin 
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当然 ,麻烦 在 于 一 些 骨 节 上 :CembineSiblings 如 何 实 现 ? 已 经 棍 出 几 种 变化 ,但 是 者 不 能 
证 明 它 们 能 够 提供 如 斐 波 那 契 堆 那 样 相同 的 摊 还 界 。 部 使 这 样 ,对 于 涉及 大 量 DecreaseKey 
操作 的 一 般 图 论 应 用 来 说 ,图 12-51 中 的 方法 似乎 总 基 和 和 其 他 堆 结 构 一 样 运 行 芯 至 比 它们 ( 包 
Th X HE) BRE. 
























/* Assumes FirstSibling is NOT NULL */ 


PairHeap 
CombineSiblings¢ Position FirstS7bling ) 


int 1, j. NumSihlings; 


/* IF only one tree, return it */ 
ifi First&ibling-»NextSibling == NULL } 
return FirstSibl ing; 


| 

static Position TreeArray[{ MaxSiblings ]; 

/* Place each subtree in TreeArray */ 

for( NumSiblings = 0; FirstSibling != NULL; NumSiblings++ 2 

{ 
TreeArrav[ NumSiblings ] = fFirstSibling; 
Firstsibling-»Prev-»NextSibling = NULL; /* Break links */ 
FirstSipling = FirstSibling->NextSibling: 

| 

TreeArray[ NumSiblings ] = NULL; 





/* Combine the subtrees two at a time, */ 
/* going ieft to right */ 
for( 1 = 0; i + 1 < NumSibtings: i += 2 2 
TreeArray[ i ] = CompareAndL ink 
TreeArray[ 1 ], TreeArray[ 3 + 1 ] 3; 
/* j has the result of the last CompareAndLink */ 
/* If an odd number of trees, get the last one +f 
= 了 一 5 
if( j == NumSiblings - 3 2 
TreeArray[ j ] = CompareAndLink( 
TreeArray[ į }, TreeArray[ j+ 2 l); 


/* Now go right to left, merging last tree with */ 
/* next to last. The result becomes the new last */ 
for( ; j >= 2; j -= 22 

TreeArray[ j - 2 1 = CompaceAndL ink( 
TreeArray[ j - 2 1}, TreeArray[ j 1 5; 


return TreeArrayl 0 j; 


图 12-51 Mr: AAIE 


这 种 方法 是 已 经 提出 的 许多 变形 方法 中 最 简单 和 最 实际 的 方法 ,我 们 称 之 为 两 趟 合并 法 
(two-pass merging)» 首先 ,我 们 从 左 到 右 扫 描 , 合 并 语 儿子 对 .= 在 第 一 次 扫描 之 后 ,我们 有 一 
半数 量 的 树 要 合并 。 RAT TS BAH, MERA. 在 每 一 步 ,我 们 将 第 一 次 扫描 剩 下 的 最 
右边 的 树 和 当前 合并 的 结果 合并 。 例如 ,如 果 有 8 个 儿子 cl 到 cg, 那么 第 一 次 扫描 进行 c 和 


——- ———————— 
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caca Fl cascs M cg cy 和 ca WAH. BERGE dida ds A das RINELLA H d 和 da fA 
行 第 二 未 打 摘 ,然后 da 和 这 个 结果 合并 .最 后 d, 再 利 刚 得 到 的 结果 台 并 。 

这 蛙 的 实现 方法 要 求 一 个 数组 存储 诸 子 树 。 在 最 坏 情 形 下 ,可 能 有 N- 1 项 部 是 根 的 儿 
子 , 因 此 这 个 数组 必然 很 大 . 

其 他 一 些 合并 方法 在 练习 中 讨论 。 惟 - :简单 的 而 用 容易 发 现 缺 从 的 合并 方法 是 从 左 到 石 
PRB AISA 12.35)。 配 对 堆 是 “简单 即 更 好 "的 一 个 很 好 的 例子 ,并 且 似 乎 二 要求 De- 
creaseKey 或 Merge 操作 的 一 些 重要 应 用 所 选择 的 方法 。 


总 结 


it =A 


企 这 --- 音 ,我 们 看 到 并 及 查找 树 儿 各 有效 的 变种 。 自 项 向 下 伸展 树 提 供 O Cog ) 捧 还 性 
能 ,treap 树 给 出 O(logN) 随 机 化 的 性 能 ,而 红 黑 树 .确定 性 跳跃 表 和 AA- 树 则 均 给 出 对 基本 操 
作 的 O(logN) 最 坏 情 形 性 能 。 在 各 种 结构 之 间 的 交换 涉及 代码 复杂 性 ,删除 的 简易 性 以 及 不 
癌 的 查找 和 播 人 的 开销 。 很 难说 哪 种 结构 是 明显 的 赢家 。 复 现 的 论题 包括 树 的 旋转 以 及 标 并 
节点 的 使 用 以 避免 对 NULL 指针 许多 信人 的 测试 , 若 不 标记 节点 则 这 些 测 试 原本 是 必 不 可 少 
的 ,， 即 使 理论 的 界 水 是 最 优 的 ,kd 树 还 是 给 出 了 执行 范围 查找 的 实际 方法 。 

最 后 ,我们 描述 配对 堆 并 将 配对 堆 编 程 , 它 似 平 是 最 实际 的 可 合并 的 优先 队列 ,特别 是 当 
需要 DecreaseKey 操作 的 时 候 。 不 过 ,经 验 的 结果 尚未 得 刘 解 析 方法 的 分 析 证 实 ， 


练习 


] WEAR A Mm FRE seed B OtlogN). 
212.2. 证 明 对 于 从 底 向 上 展开 存在 每 次 访问 需要 2logN 次 旋转 的 访问 序列 。 


12.3. 修改 伸展 树 以 支持 对 第 上 & 个 最 小 项 的 查询 。 在 确定 性 跳 牙 表 中 如 司 处 理 ? 

12.4 从 经 验 上 比较 简化 的 从 项 向 下 展开 和 原始 描述 的 从 项 同 下 展开 : 

12.5 编写 关于 红 黑 树 的 删除 过 程 。 

12.6 证明 红 黑 树 的 高 度 最 多 为 2logN ,并 证 明 这 个 界 实质 上 不 能 再 降低 。 

12.7 USA AVL 树 都 可 以 被 涂 成 红 黑 树 . 所 有 的 红 黑 树 都 是 AVL RS? 

12.8 证 明 1-2-3 确定 性 跳跃 表 可 以 表示 成 2 3-4 树 , 它 的 项 在 内 部 节点 以 及 横 叶 上 。 
9 


如 果 我 们 试图 插 人 已 经 在 确定 性 跳跃 考 中 存在 的 项 ,那么 会 发 生 什么 情况 ? 

12.10 证 明 在 1-2-3 确定 性 跳跃 表 中 最 多 能 够 用 到 2N T 

.12.11 我 们 可 以 用 CC 语言 把 每 一 个 抽象 节点 表示 成 动态 分 配 的 前 向 指针 数组 以 代 奉 指针 
链表 。 指 出 如 何 用 这 种 方法 实现 1-2-3 确定 性 跳 牙 表 并 保持 每 个 操作 的 O ClogN ) 时 
EES 

12.12 EBXT 1223 ME EBRA HWRE 

12.13 证 明 AA- 树 中 关于 删除 的 算法 是 正确 的 。 

12.14 给 出 AA 树 的 一 种 非 递归 的 白 顶 向 下 实现 方法 。 将 其 与 课文 中 的 实现 方法 在 简单 性 
利 效率 方面 进行 比较 。 

12.15 递归 地 编写 出 Skew 过 程 和 Split 过 程 ,使 得 对 删除 操作 每 个 过 程 只 需 调 用 一 次 、 

1016 AA RHE FTO REPEAL BB 树 少 多 少 行 9 这 能 使 AA- 树 更 快 吗 ? 

D.U ”通过 使 用 一 个 栈 来 非 递归 地 实现 treap 树 的 插 人 人 例 程 。 这 种 努力 值得 吗 ? 
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12.18 


«« 12.19 
12.20 
12.21 


12.27 


12.28 
12.29 


12.30 
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- -一 一 一 


通过 使 用 访问 次 数 作 为 优先 级 并 在 每 次 访问 后 党 要 时 执行 旋转 我 们 可 以 使 treap 树 
成 为 是 自 调 整 的 结构 。 将 这 种 方法 和 随机 北方 法 进行 比较 。 或 者 ,在 每 次 访问 一 项 
时 生成 一 个 随机 数 。 如 果 这 个 数 小 于 X MRT AEE ARACA X 的 新 
的 优先 级 (执行 相应 的 旋转 )。 

让 明 , 恕 困 把 项 排序 ,那么 如 使 优先 级 并 未 排序 ,treap 树 也 可 以 以 线性 时 间 构 造 ， 
不 用 NullNode 标记 实现 某 些 树 结 构 。 使 用 标记 可 以 节省 多 少 编程 工作 ” 

假设 对 于 每 个 节点 我 们 把 NULL 上 指针 的 个 数 存 储 在 它 的 子 树 中 , 称 之 为 节点 的 权 
Cweight}。 采 用 下 列 方 法 :如 果 左 子 树 和 厂子 树 的 权 相 差 趋 出 因子 2, 那么 彻 扶 重建 
根 在 该 节点 的 子 树 。 证 明 下 列 结论 : 

a. 我 们 能 够 以 O(5) 重 建 一 个 节点 ,其 中 S 是 该 节点 的 权 。 

b. 该 算法 每 次 插 和 人 操作 的 挫 还 时 间 为 O(logN)。 

c. 我 们 能 够 以 O(Slog5) 时 间 在 kd 树 中 重建 一 个 节点 ,其 中 S 是 该 节点 的 权 . 

d. 我 们 可 以 将 该 算法 用 于 kd 树 ,其 每 次 插 人 的 代价 为 O(logN). 

假设 我 们 对 任意 一 棵 2-d 树 调用 SingleRotateWithLeft。 详 细 解 释 其 结果 不 有 是 一 
棵 可 用 的 2-4 树 的 全 部 原因 。 

实现 对 于 有 do WEGA MAHAA. 不 要 使 用 递归 . 

对 于 对 应 于 久 =3,4,5 的 PP 的 值 ,确定 部 分 匹配 查询 的 时 间 。 

对 于 一 棵 理想 平衡 &a 树 , 求 出 课文 中 引用 的 一 次 范围 查询 (参见 12.6 市 ) 的 最 坏 全 
形 运行 时 间 。 

2.d HE(2Q-d heap) 是 允许 每 一 项 拥有 阿 个 单个 关键 字 的 一 种 数据 结构 。DeleteMin $ 
作 可 以 对 于 这 两 个 关键 字 中 的 任 一 个 执行 。2-d 堆 是 共有 下 述 性 质 的 充 全 一 又 怪 : 
对 于 偶数 深度 上 的 任 一 节点 和 ,存储 在 X 上 的 项 具有 它 的 子 树 上 最 小 的 下 1 关键 
= .而 对 于 奇数 深度 上 的 任 -节点 X FE X 上 的 项 具有 它 的 子 树 上 最 小 的 二 2 
关键 字 。 

a. 画 出 美 于 (1.10),(2,9),(3,8),(4,7),(5,6) 诸 项 的 一 个 可 能 的 2-d HE. 

. 如 柯 找 出 具有 最 小 # ] 关键 子 的 项 ? 

.如何 找 出 具有 最 小 # 2 关键 字 的 项 ? 

EB -个 将 一 新 的 项 插 人 到 2-4 堆 中 的 算法 ， 

, 给 出 一 个 对 于 任 一 关键 字 执行 DeleteMin 操作 的 算法 。 

. 给 出 一 个 以 线性 时 则 实施 FixHeap 的 算法 。 

将 前 面 的 练习 推广 以 得 出 一 个 kd 堆 , 在 这 个 堆 中 每 一 项 都 可 有 k PET RES 
你 应 该 能 够 得 到 下 列 的 界 : 以 O(logN) 实 施 Insert, LA O(2*logN) 实 施 DeleteMin, A 
及 以 OCEN) 执 行 FixHeap. 

ER bd 堆 可 以 用 于 实现 双 端 优先 队 州 。 

抽象 地 推广 kd 堆 使 得 只 有 都 些 根据 关键 字 1 分 支 的 层 有 两 个 儿子 (所 有 其 他 层 必 
有 一 个 儿子 )。 

a. 我 们 需要 指针 吗 ? 

b. 显然 ,那些 基本 算法 仍然 有 效 , 它 们 的 新 的 时 间 界 是 多 少 ? 

使 用 kad 树 实 现 DeleteMin。 对 于 随机 树 , 你 期 望 其 平均 运行 时 间 是 多 少 ? 
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12.31. (FA kd EEEIEE 3.26), AATRE FF DeleteMin. 
12.32 重用 一 个 NullNode 标记 实现 配对 堆 ， 
ax 12.33 TEAR SPR PROB HEE ,每 次 操作 的 挫 还 时 间 为 O(logN). 

12.34 CombineSiblings 的 另 一 种 方法 是 把 所 有 的 兄弟 部 放 到 一 个 队列 中 ,并 反复 Dequeue 
及 合并 队列 中 的 前 两 项 JAA A SBR APE. 

12.35 在 前 面 的 练习 中 不 用 队列 而 使 用 栈 是 个 坏 主 意 , 通 过 给 种 一 个 序列 导致 每 次 操作 人 花 
£t 人 NI) 来 妥 以 说 明 。 这 就 是 从 左 到 右 单 畏 全 并。 

12.36 不 用 DecreaseKey 我 们 可 以 除去 父 指 针 。 使 用 斜 堆 结果 会 如 们 ? 
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标记 节点 的 实现 在 [14] 给 出 , 它 提供 了 NullNode RATERS ATR ARE BE. PAE HEBER KR 
其 变种 在 [22] 和 [251 中 讨论 。 对 称 二 叉 巴 树 来 源 于 [6] ,课文 中 讨论 的 AAR ERKA T . 
和 "3] 中 的 描述 。Treap BEA] EJECT | 30 ] P IRR BRE S HF JURE Cartesian tree). 相关 的 数据 结 
构 是 优先 查找 树 (priority search tree) £20], 

Ed 树 首先 在 171 中 介绍 。 其 他 的 范围 -查找 算法 在 [8]j 中 措 述 。 在 平衡 kd 树 上 范围 查 
找 的 最 坏 情 形 在 [18] 中 得 到 ,而 课文 中 引用 的 平均 情形 结果 采 自 [131 积 [10] 

配对 堆 及 在 练习 中 提出 的 变种 在 '15] 中 描述 。 论文 [17] 提 出 伸展 树 是 充 不 需要 De- 
creaseKey 操作 时 选择 的 优先 队列 。 另 外 一 篇 论文 [28] 提 出 配对 堆 达 到 与 裴 波 那 契 堆 相 同 的 
渐进 界 但 在 实践 中 性 能 更 好 。 然 而 , -篇 使 用 优先 队列 实现 最 小 生成 全 算法 的 相关 论文 [21， 
提出 DecreaseKey 的 捧 还 时 间 不 是 OU 

大 部 分 练习 的 解 可 以 在 原始 参考 文献 中 找 色 。 练 习 12.21 代表 多 少 有 些 流行 的 一 种 " 刁 
居 " 平 衡 方法 。[191.[5] .111] 和 i191] 描述 一 些 特殊 的 方法 ; [2] 指 出 在 一 -种 框架 肉 如何 实现 所 
有 这 些 方法 。 满 足 练习 12.21 中 的 性 质 的 树 是 加 权 平 衡 (weight-balanced) 的 。 这 些 树 也 可 通 
过 旋转 保持 其 特性 [231。(d) 问 取 自 124]。 练习 12.26 到 12.28 的 解 可 以 在 [12] 中 找到 ， 
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